반응형
✅ Vector Database란?
- 벡터 검색(Vector Search)을 효율적으로 수행할 수 있게 설계된 데이터베이스이다.
- 숫자로 표현된 벡터 데이터를 저장하고, 그 벡터들 간의 유사성을 빠르게 검색할 수 있다.
Vector 데이터 예시
"고양이" → [0.12, -0.53, 0.87, ...] (512차원 벡터)
"강아지" → [0.11, -0.50, 0.85, ...]
🔸 Vector Database는 필요한 이유
- 사용자의 질문/프롬프트를 벡터로 인코딩(embedding) 해서, 유사한 벡터 데이터를 빠르게 검색할 수 있다
- Keyword Search 보다 빠르게 검색 가능
- 예시: 고객이 제품에 대해 질문하면, 벡터 DB에서 제품 매뉴얼 문서 중 가장 관련 있는 내용을 찾아서 제공
🔸 Semantic Search vs Keyword Search
- Keyword Search: 정확한 단어를 기반으로 검색 (예: "가격" 검색→ "가격"만 제공)
- Semantic Search: 단어의 의미를 고려한 검색 (예: "가격" 검색→ : "가격","비용", "요금" 등도 포함 가능)
- BERT 같은 임베딩 모델로 문서(데이터)를 임베딩하여 OpenSearch에서 검색 성능 향상 가능.
🔸 Vector DB를 사용할 수 있는 AWS 서비스
서비스 | 설명 및 특징 |
Amazon OpenSearch Service | k-NN 플러그인으로 벡터 검색 가능. 대용량 데이터 검색에 적합. 시각화 대시보드도 제공. |
Amazon Aurora / RDS (PostgreSQL) | pgvector 확장 사용해 벡터 저장 및 검색 가능. 기존 DB와 통합에 유리. |
Amazon Neptune | 그래프 DB 기반, 벡터와 그래프 관계형 검색에 적합. |
Amazon DocumentDB (with MongoDB compatibility) |
문서형 DB지만 향후 벡터 검색도 가능. MongoDB 호환. |
Amazon Bedrock (Knowledge Bases) |
완전 관리형 RAG 구현. S3 문서를 벡터화하여 자동 저장/검색함. |
Amazon OpenSearch Serverless (Vector Engine) |
인프라 관리 없이 벡터 저장/검색 기능 제공. LLM 기반 검색 애플리케이션에 적합. |
반응형
'클라우드(AWS) > AIF-C01' 카테고리의 다른 글
[AWS] 생성형 AI 모델 평가 지표 (ROUGE, BLEU, BERTscore, Perplexity) (0) | 2025.05.12 |
---|---|
[AWS] FM, Foundation Model의 훈련 과정 (Domain Adaptation Fine-tuning, Instruction-based Fine-tuning, RLHF) (0) | 2025.05.12 |
[AWS] Diffusion Models(디퓨전 모델)이란? 쉽게 정리 (0) | 2025.05.10 |
[AWS] Unimodal과 Multimodal란? 쉽게 정리 (0) | 2025.05.09 |
[AWS] Data Augmentation (데이터 증강)란? 쉽게 정리 (0) | 2025.05.07 |