10분 만에 RAG 이해하기

  • 관리자 신현승
  • 카테고리: 개발이슈
  • 조회수: 779
  • 작성일:

소프트웨어 산업에서 수많은 새로운 약어와 개념이 등장하고 있습니다. 특히 AI 기술의 변화를 쉽게 느낍니다.

1999년 빌 게이츠의 “생각의 속도”에서 “새로운 테크놀로지를 이해하기 위해서는 이전 기술에 대한 이해가 필요하다.”는 말이 특히 공감되는 시대입니다.

밀레니엄 전 출간된 빌 게이츠의 “생각의 속도” <출처: 청림출판, 교보문고 캡처>

최근 LLM과 AI 기술의 발전이 가속화되고 있으며, 메타의 라마(LLama)와 AGI, RAG 같은 새로운 개념들이 부각되고 있습니다. 이 글에서는 RAG를 심층적으로 설명하겠습니다.


RAG(Retrieval-Augmented Generation)

"검색 증강 생성"이라고도 불리는 RAG의 의미를 분석해 보겠습니다.

1. Retrieval: '검색'의 의미는 "어딘가에서 정보를 가져오는 것"입니다.

2. Augmented: '증강'은 원래의 것에 추가하여 향상시키는 의미입니다.

3. Generation: '생성'은 사용자 질문에 대한 텍스트 응답을 만들어내는 것을 의미합니다.

현재 많은 LLM들이 존재하고 있으며, 그들은 훈련된 데이터에 기반해 응답합니다. 그러나 최신 정보를 반영하지 않는 문제가 발생할 수 있습니다.

<출처: 챗GPT 캡처>

따라서 LLM을 최신 정보로 유지하기 위한 프레임워크로 RAG가 제안되었습니다.

LLM의 문제가 될 수 있는 두 가지 요인은:

1. **출처 부족**: LLM이 본인의 기억에 의존하여 잘못된 정보를 제공할 수 있습니다.

2. **정보 업데이트 부족**: 시대에 뒤떨어진 정보로 인해 부정확한 답변을 할 수 있습니다.

LLM 의 전형적인 문제 두 가지 <출처: 작가>

RAG를 도입하면 LLM이 지식 콘텐츠 저장소를 이용해 사용자 질의와 관련된 정보를 검색하도록 할 수 있습니다. 이를 통해 더욱 정확하고 신뢰할 수 있는 답변을 제공할 수 있습니다.

결론적으로, RAG는 정보의 정확성을 높이고 최신 정보를 지속적으로 업데이트할 수 있는 방법입니다.


이제 RAG에 대한 개요를 마치겠습니다. 다음 글에서는 <10분 만에 랭체인(LangChain) 이해하기>로 이어지겠습니다. 감사합니다!

<원문>

10분 만에 RAG 이해하기
 


해당 기사는 GPT를 이용하여 요약한 내용입니다.

원문보기


코멘트 (0)