[AWS] Multi-modal Embedding Model란? 쉽게 정리

클라우드(AWS)/AIF-C01

찌르비 2025. 4. 24. 22:55

다양한 종류의 데이터(예: 텍스트, 이미지, 오디오 등)를 입력으로 받을 수 있는 모델이에요.

(데이터 종류 상관없이 embedding 할 수 있다)

예시: Chatgpt에 문장, 이미지 상관없이 질문할 수 있기 때문에 Chatgpt도 Multi-modal Embedding Model이다.

AI는 사진이나 문장을 그냥 이해 못 한다.

그래서 입력한 데이터를 숫자로 바꿔줘야 한다. 이 때 바꾸는 작업을 embedding이라고 한다.

AI 실무자가 기본 모델(FM)을 사용하여 검색 애플리케이션을 설계하려고 합니다. 이 검색 애플리케이션은 텍스트와 이미지가 포함된 쿼리를 처리해야 합니다. 어떤 유형의 기본 모델(FM)을 사용해야 할까요?

정답. 3번