클라우드(AWS)/AIF-C01
[AWS] Diffusion Models(디퓨전 모델)이란? 쉽게 정리
찌르비
2025. 5. 10. 16:22
반응형
Diffusion Models (디퓨전 모델)이란?
이미지, 오디오, 텍스트 등 새로운 데이터를 생성하는 데 사용되는 생성형 AI 모델이다.
Diffusion Models은 처음엔 노이즈 이미지(랜덤한 것)로 시작해서 점차 고품질 이미지로 복원하는 방식이다.
- 앞 방향(Forward diffusion): 이미지에 노이즈를 점점 추가해서, 완전히 무작위 노이즈로 만든다.
- 역 방향(Reverse diffusion): 노이즈를 조금씩 제거하며 이미지 복원
예시: Diffusion Models 이미지 생성
- Forward diffusion | 깨끗한 이미지(훈련 데이터) → 조금 흐릿함 → 많이 흐릿함 → 완전 노이즈 |
- Reverse diffusion | 완전 노이즈 → 흐릿한 윤곽 → 더 선명 → 진짜 같은 이미지 🎉 |
🤔 왜 노이즈를 넣었다가 다시 제거할까?
> 처음부터 이미지를 그냥 생성하라고 하면 너무 어렵다.
> 그래서 "먼저 이미지를 망가뜨리고, 다시 복원하는 과정을 학습" 시킨다.
Stable Diffusion
👉 Diffusion 모델의 한 종류
🎨 이미지를 생성하거나 텍스트를 그림으로 바꾸는 AI 모델
픽셀 이미지 전체에서 직접 노이즈 제거하지 않고, 이미지를 압축(latent space)한 상태에서 학습하고 생성함
→ 더 빠르고, 더 효율적이에요!
반응형