RAG (Retrieval-Augmented Generation)
👉 뜻 그대로 해석하기
- Retrieval (검색): 정보를 찾아오기
- Augmented (보강된): 강화된, 보완된
- Generation (생성): 답변을 만들어내기
AI가 정보를 찾아와서 보완한 뒤에 답변을 만들어내는 기술이다.
AI한테 질문할 때마다, 실시간으로 외부 데이터(지식 베이스:Knowledge Base)를 가져와서 참조시킨다.
LLM (대형 언어 모델) 기반 AI에서 사용된다.
LLM 모델 | 설명 |
OpenAI GPT-4 | ChatGPT에 쓰이는 모델 |
Amazon Titan | AWS의 LLM |
Anthropic Claude | 대화형 AI 모델 |
Google Gemini | 구글의 AI 모델 |
📌 RAG 필요한 이유
기존의 GPT와 같은 AI 모델은 학습한 지식만 사용해서 답을 만들어냈었다 (개발자가 직접 데이터를 학습시킴)
→ 문제점: 😢새로운 정보나 최신 데이터는 모를 수 있다.
그래서 등장한 게 RAG(Retrieval-Augmented Generation)이다!
📌 RAG 장점
🔄 재학습 불필요, 모델을 자주 다시 학습(fine-tuning)할 필요 없음
📚 최신 정보 실시간으로 최신 문서를 읽어올 수 있음
🧠 정확도 향상, 문맥에 딱 맞는 답변 가능
📌 RAG 작동 방식
1. 문서 수집 및 정리 (FAQ, 정책, 가이드 등)
2. 문서를 Embedding 처리 (숫자 벡터로 변환)
3. Vector DB에 저장 (FAISS 등)
4. 사용자가 질문
5. 관련 문서를 검색 (Retriever)
6. 검색된 문서 + 질문 → LLM에 전달
7. LLM이 문맥 반영하여 답변 생성
🤔 문제
한 회사가 고객 서비스 상담원이 자주 묻는 질문에 응답할 수 있도록 돕기 위해 AI/ML 솔루션을 배포했습니다.
이 질문들은 시간이 지나면서 변경될 수 있습니다. 회사는 고객 서비스 상담원이 질문을 하고 일반적인 고객 질문에 대해 자동으로 생성된 답변을 받을 수 있도록 하길 원합니다.
이 요구 사항을 가장 비용 효율적으로 충족하는 전략은 무엇입니까?
- 모델을 정기적으로 파인 튜닝(Fine-tune)한다.
- Context data를 사용하여 모델을 학습시킨다.
- Context data를 사용하여 모델을 사전 학습(Pre-train)하고 벤치마크한다.
- 프롬프트 엔지니어링 기술과 함께 RAG(Retrieval Augmented Generation)를 사용한다.
정답
정답. 4번
RAG는 대규모 사전 학습 모델과 검색 메커니즘을 결합하여, 지식 베이스에서 관련된 문맥을 가져오는 방식이다.
모델을 자주 재훈련할 필요가 없기 때문에 비용 효율적이며, 응답이 문맥적으로 정확하고 최신 상태를 유지할 수 있도록 한다.
'클라우드(AWS) > AIF-C01' 카테고리의 다른 글
[AWS] 머신러닝 모델 학습 과정 (Hyperparameter Tuning) 쉽게 정리 (0) | 2025.04.23 |
---|---|
[AWS] 머신러닝 파이프라인(ML Pipeline) 쉽게 정리 (0) | 2025.04.22 |
[AI🧠] 머신러닝 용어 쉽게 정리 (Overfitting:과적합, Underfitting:과소적합, Bias:편향) (0) | 2025.04.18 |
딥러닝(Deep Learning)이란? 쉽게 정리 (0) | 2025.04.15 |
[AWS] Model Artifacts란? Inference 종류 (Real-time, Batch, Asynchronous, Serverless) 쉽게 정리 (0) | 2025.04.15 |