반응형
Data Augmentation (데이터 증강)
Data augmentation은 기존의 데이터를 약간 변형해서 새로운 데이터를 만들어내는 기술이다.
이는 주로 머신러닝 모델(이미지, 자연어 처리)의 성능을 높이기 위해, 훈련시키기 위한 데이터량을 늘릴 때 사용한다
📌이해하기 위한 간단한 예시: 이미지 생성 모델
학습 데이터로 남성만 포함된 "의사" 이미지 사용하면, 남자라는 편향이 생긴다.
Data Augmentation를 통해 여성을 의사로 표현한 이미지 만들어 직업과 성별 간의 편향을 줄일 수 있다.
이미지 데이터 증강 방법
이미지 데이터를 증강할 때 흔히 사용하는 기법:
- 회전 (rotate)
- 좌우 반전 (flip)
- 확대 또는 축소 (zoom in/out)
- 밝기 조절 (brightness adjustment)
- 노이즈 추가 (add noise)
- 색상 변화 (color jitter)
Data Augmentation 특징
- 데이터 부족 보완: 학습 데이터가 적을 때 데이터 수를 늘리기 위해
- 편향(Bias) 제거: 특정 클래스나 특성이 너무 많이 나타나는 경우 균형을 맞추기 위해
- 과적합(Overfitting) 방지: 모델이 학습 데이터에 너무 의존하지 않게 일반화 성능을 높이기 위해
🤔 문제
한 AI 개발자가 다양한 직업을 가진 사람들의 이미지를 생성하는 모델을 만들고 있습니다. 그런데 입력 데이터에 편향(bias) 이 존재하고, 특정 속성이 이미지 생성에 영향을 주어 모델에 편향이 생기는 문제가 발견되었습니다.
이 문제를 해결할 수 있는 기술은 무엇입니까?
- 불균형 클래스에 대한 데이터 증강 (Data augmentation for imbalanced classes)
- 클래스 분포에 대한 모델 모니터링 (Model monitoring for class distribution)
- 검색 증강 생성 (Retrieval Augmented Generation, RAG)
- 이미지에 대한 워터마크 감지 (Watermark detection for images)
정답
더보기
정답. 1번
반응형
'클라우드(AWS) > AIF-C01' 카테고리의 다른 글
[AWS] Diffusion Models(디퓨전 모델)이란? 쉽게 정리 (0) | 2025.05.10 |
---|---|
[AWS] Unimodal과 Multimodal란? 쉽게 정리 (0) | 2025.05.09 |
[AWS] Generative AI Security Scoping Matrix란? 쉽게 정리 (0) | 2025.05.04 |
[AWS] Prompt(프롬프트)란? 쉽게 정리 (Prompt Engineering, Context, Prompt Template, Latent Space, Hallucination) (0) | 2025.05.04 |
[AWS] AWS Artifact란? 쉽게 정리 (0) | 2025.05.04 |