[AWS] FM, Foundation Model의 훈련 과정 (Domain Adaptation Fine-tuning, Instruction-based Fine-tuning, RLHF)

[AWS] Nitro System란? 쉽게 정리 (1)	2025.05.12
[AWS] 생성형 AI 모델 평가 지표 (ROUGE, BLEU, BERTscore, Perplexity) (0)	2025.05.12
Public Model Leaderboards란? 쉽게 정리 (공개 모델 리더보드) (0)	2025.05.11
[AWS] Graviton란? 아주 쉽게 정리 (AWS에서 만든 서버용 CPU, x86, ARM 아키텍처) (0)	2025.02.04
[AWS] Amazon Data Lifecycle Manager(DLM)란? 쉽게 정리 (EBS Volume Snapshot 생성 자동화) (0)	2025.01.27

종류	설명	특징
🟠 Full Fine-tuning	전체 모델 파라미터를 업데이트	많은 리소스 필요
🟢 PEFT (Parameter-Efficient Fine-Tuning)	일부 파라미터만 학습	저비용/저메모리, 대표 기술: LoRA
🔵 LoRA (Low-Rank Adaptation)	각 Transformer 층에 소형 행렬을 추가	원래 가중치는 그대로 유지
🟣 ReFT (Representation Fine-Tuning)	숨겨진 표현(embeddings)에만 개입	모델 본체는 완전히 고정
🟡 Multitask Fine-tuning	여러 작업(요약, 번역 등)을 동시에 학습	Catastrophic forgetting 방지 효과
⚫ Domain Adaptation Fine-tuning	특정 도메인(예: 의료, 법률)에 맞게 조정	특정 분야, 전문 용어(jargon)에 효과적
⚫ Instruction-based Fine-tuning	라벨이 달린 데이터(labeled data)를 사용해서 조정 “이런 입력에는 이런 출력을 해야 한다”라는 관계 학	더 정확하고 일관된 답변을 하게 한다. (프롬프트만으로는 가끔 이상한 답변이 나올 수 있다)
🔴 RLHF (Reinforcement Learning from Human Feedback)	사람의 피드백으로 모델을 보상하며 훈련	사람의 기대에 맞는 응답 생성에 유리

목적	서비스
Low-code 데이터 전처리	SageMaker Canvas
확장 가능한 전처리	오픈소스 프레임워크 (EMR + Spark, Hive, Presto)
서버리스 기반 전처리	AWS Glue
SQL 기반 전처리	SageMaker Studio의 Jupyter Lab
피처 스토리지 및 검색	SageMaker Feature Store
편향성 분석	SageMaker Clarify
라벨링 자동화	SageMaker Ground Truth

✅ Foundation Model의 훈련 과정: 3단계