📌 모델 학습(Training)이란?
- 머신러닝 모델은 데이터를 통해 반복적으로 학습한다.
- 이 과정에서 가중치(Weights)라는 값을 조정한다 → 이 가중치가 바로 모델이 학습한 내용이다.
- 모델은 가중치를 계속 조정하여 예측 결과를 정답에 가깝게 만든다.
🔁 반복 학습 (Iterative Training)
한 번만 학습해서는 정답을 맞추기 어려우므로, 수백~수천 번 반복하면서 오류(Error)를 줄이는 방향으로 가중치를 바꾼다.
🔧 하이퍼파라미터 튜닝 (Hyperparameter Tuning)
📌 하이퍼파라미터(Hyperparameter)란?
- 머신 러닝 모델의 구조나 학습 방식을 정하는 외부 설정 값이다.
- 학습률 (Learning rate)
- 에폭 수 (Epochs)
- 미니배치 크기 (Batch size)
- 신경망 레이어 수, 은닉층 수, 노드 수
- 하이퍼파라미터는 모델이 학습하기 전에 사람이 직접 설정해줘야 한다.
- (학습 도중에 자동으로 조정되는 파라미터(예: weight, bias) 와는 다르다)
- 성능이 좋은 모델을 만들기 위해, 다양한 조합을 실험하면서 최적의 값을 찾아야 합니다.
📌 하이퍼파라미터 튜닝(Hyperparameter Tuning)
하이퍼파라미터 튜닝(Hyperparameter Tuning)은 머신러닝 모델의 정확도(성능)을 높이기 위해 하이퍼파라미터 값을 조정하는 과정이다.
잘 튜닝된 하이퍼파라미터는 과적합(overfitting) 또는 과소적합(underfitting) 을 방지하고 모델이 실제 데이터에서 더 잘 작동하도록 도와준다.
🔍 튜닝 방법
Grid Search:
가능한 모든 조합을 다 시도
⛔ 시간이 오래 걸림
Random Search:
무작위 조합을 시도
빠르고 효율적일 수 있음
(모든 조합을 확인하지 않기 때문에 최적의 조합을 놓칠 수도 있음)
Bayesian Optimization:
과거 결과를 바탕으로 더 좋은 조합을 예측하며 시도
✅ 고급 방법, 자주 사용됨
(확률 모델을 사용해서 좋은 값이 나올 가능성이 높은 곳을 먼저 시도)
참고: Amazon SageMaker Automatic Model Tuning (AMT):
AWS에서는 AMT로 자동 튜닝 가능
🎯 원하는 평가 지표(예: Accuracy, AUC 등)를 기준으로 최적 조합 탐색
🧪 실험 (Experiment) 관리
SageMaker Experiments란?
- 머신러닝의 실험을 체계적으로 관리할 수 있게 도와주는 기능이다.
- 여러 번의 학습 시도(Training Run)를 정리해서 보고 비교할 수 있다.
- 어떤 실험이었는지, 어떤 파라미터를 썼는지,성능을 비교해서 가장 좋은 모델을 찾을 수 있다.
SageMaker Automatic Model Tuning (AMT)
- 자동으로 여러 모델을 학습시켜서, 가장 좋은 하이퍼파라미터 조합을 찾아준다.
- 예: 이진 분류 모델에서, AUC 점수를 기준으로 최고의 성능을 찾도록 설정
✅ 모니터링 (Monitoring)
머신 러닝 모델을 배포한 후에는 시간이 지나면서 성능이 떨어질 수 있다.
이유는 크게 세 가지이다.
- 데이터 품질 저하 (Data Quality)
- 모델 자체의 품질 문제 (Model Quality)
- 모델 편향 (Model Bias)
그래서 모델을 지속적으로 모니터링(Monitoring) 해야 한다.
- 새로운 데이터를 수집하고(training data와 비교)
- 규칙(Rules)을 설정해서 이상을 탐지
- 알람(Alert)을 보내기
- 재학습(Re-training) 프로세스를 자동으로 시작할 수 있도록 설정하기.
📌 예: 모델 성능이 떨어지는 이유 2가지
- 데이터 드리프트 (Data Drift): 학습 때와는 데이터 분포가 달라진 경우
- 컨셉 드리프트 (Concept Drift): 목표 값(target)의 의미가 변함
→ 둘 다 모델 성능이 나빠짐
🔧 Amazon SageMaker Model Monitor
- 모델의 운영 상태를 모니터링하는 서비스
- 데이터 수집 → 학습 데이터와 비교 → 규칙 위반 여부 판단
- 결과는 SageMaker Studio에서 보고, CloudWatch로 알림 보내서 재학습 자동 시작 가능
⚙️ MLOps란?
DevOps의 머신러닝 버전
- 사람이 직접 하는 수작업을 자동화
- 코드 테스트, 배포 자동화
🧰 Amazon SageMaker Pipelines
ML 파이프라인을 쉽게 구성하고 자동화할 수 있다.
주요 기능:
- 여러 작업(SageMaker job)을 순서대로 자동 실행
- 모델을 실시간 배포 또는 배치로 추론
- 모든 작업의 흐름(라인리지)을 추적
- Python SDK 또는 JSON으로 정의 가능
- 조건 분기(if문)도 가능함
- 결과는 SageMaker Studio에서 시각화
'클라우드(AWS) > AIF-C01' 카테고리의 다른 글
[AWS] Multi-modal Embedding Model란? 쉽게 정리 (0) | 2025.04.24 |
---|---|
[AWS] ML 효율성 측정 지표 (0) | 2025.04.24 |
[AWS] 머신러닝 파이프라인(ML Pipeline) 쉽게 정리 (0) | 2025.04.22 |
RAG (Retrieval-Augmented Generation)란? 쉽게 정리 (0) | 2025.04.21 |
[AI🧠] 머신러닝 용어 쉽게 정리 (Overfitting:과적합, Underfitting:과소적합, Bias:편향) (0) | 2025.04.18 |