반응형
Diffusion Models (디퓨전 모델)이란?
이미지, 오디오, 텍스트 등 새로운 데이터를 생성하는 데 사용되는 생성형 AI 모델이다.
Diffusion Models은 처음엔 노이즈 이미지(랜덤한 것)로 시작해서 점차 고품질 이미지로 복원하는 방식이다.
- 앞 방향(Forward diffusion): 이미지에 노이즈를 점점 추가해서, 완전히 무작위 노이즈로 만든다.
- 역 방향(Reverse diffusion): 노이즈를 조금씩 제거하며 이미지 복원
예시: Diffusion Models 이미지 생성
- Forward diffusion | 깨끗한 이미지(훈련 데이터) → 조금 흐릿함 → 많이 흐릿함 → 완전 노이즈 |
- Reverse diffusion | 완전 노이즈 → 흐릿한 윤곽 → 더 선명 → 진짜 같은 이미지 🎉 |
🤔 왜 노이즈를 넣었다가 다시 제거할까?
> 처음부터 이미지를 그냥 생성하라고 하면 너무 어렵다.
> 그래서 "먼저 이미지를 망가뜨리고, 다시 복원하는 과정을 학습" 시킨다.
Stable Diffusion
👉 Diffusion 모델의 한 종류
🎨 이미지를 생성하거나 텍스트를 그림으로 바꾸는 AI 모델
픽셀 이미지 전체에서 직접 노이즈 제거하지 않고, 이미지를 압축(latent space)한 상태에서 학습하고 생성함
→ 더 빠르고, 더 효율적이에요!
반응형
'클라우드(AWS) > AIF-C01' 카테고리의 다른 글
[AWS] FM, Foundation Model의 훈련 과정 (Domain Adaptation Fine-tuning, Instruction-based Fine-tuning, RLHF) (0) | 2025.05.12 |
---|---|
[AWS] Vector Database란? 쉽게 정리 (1) | 2025.05.11 |
[AWS] Unimodal과 Multimodal란? 쉽게 정리 (0) | 2025.05.09 |
[AWS] Data Augmentation (데이터 증강)란? 쉽게 정리 (0) | 2025.05.07 |
[AWS] Generative AI Security Scoping Matrix란? 쉽게 정리 (0) | 2025.05.04 |