클라우드(AWS)/AIF-C01

[AWS] Diffusion Models(디퓨전 모델)이란? 쉽게 정리

찌르비 2025. 5. 10. 16:22
반응형

 

Diffusion Models (디퓨전 모델)이란?

이미지, 오디오, 텍스트 등 새로운 데이터를 생성하는 데 사용되는 생성형 AI 모델이다.

Diffusion Models은 처음엔 노이즈 이미지(랜덤한 것)로 시작해서 점차 고품질 이미지로 복원하는 방식이다.

https://medium.com/data-science/diffusion-models-made-easy-8414298ce4da

  • 앞 방향(Forward diffusion): 이미지에 노이즈를 점점 추가해서, 완전히 무작위 노이즈로 만든다.
  • 역 방향(Reverse diffusion): 노이즈를 조금씩 제거하며 이미지 복원

예시: Diffusion Models 이미지 생성

  1. Forward diffusion | 깨끗한 이미지(훈련 데이터) → 조금 흐릿함 → 많이 흐릿함 → 완전 노이즈 |
  2. Reverse diffusion | 완전 노이즈 → 흐릿한 윤곽 → 더 선명 → 진짜 같은 이미지 🎉 |

🤔 왜 노이즈를 넣었다가 다시 제거할까?

>  처음부터 이미지를 그냥 생성하라고 하면 너무 어렵다.
> 그래서 "먼저 이미지를 망가뜨리고, 다시 복원하는 과정을 학습" 시킨다.

 

Stable Diffusion

👉 Diffusion 모델의 한 종류

🎨 이미지를 생성하거나 텍스트를 그림으로 바꾸는 AI 모델

픽셀 이미지 전체에서 직접 노이즈 제거하지 않고, 이미지를 압축(latent space)한 상태에서 학습하고 생성함
→ 더 빠르고, 더 효율적이에요!

반응형