Amazon OpenSearch Service – Vector Search
OpenSearch Service는 Vector Search (벡터 검색) 기능을 제공한다.
이는 AI 및 머신러닝 기반 애플리케이션에서 유사한 데이터를 빠르게 검색할 수 있도록 도와주는 기능이다.
특히 추천 시스템, 이미지 검색, 자연어 처리(NLP) 기반 검색 시스템 등에 많이 사용된다.
✅ Vector Search란?
- 일반적인 검색은 "단어" 중심의 키워드 검색 (Keyword Search)이다.
- 벡터 검색은 데이터를 vector화(숫자 배열)하여 "비슷한 의미"를 가진 데이터를 검색한다.
- 예시:“강아지”라는 단어와 의미적으로 비슷한 단어들(예: 애완동물, 반려견)을 찾는 데 사용됨.
vector 예시
"고양이" → [0.12, -0.53, 0.87, ...] (512차원 벡터)
"강아지" → [0.11, -0.50, 0.85, ...]
✅ Vector Database란?
- 벡터 검색(Vector Search)을 효율적으로 수행할 수 있게 설계된 데이터베이스이다.
- 숫자로 표현된 벡터 데이터를 저장하고, 그 벡터들 간의 유사성을 빠르게 검색할 수 있다.
- 예시: Amazon OpenSearch Service, Amazon Aurora (PostgreSQL), Amazon RDS for PostgreSQL
✅ OpenSearch Vector 기능의 특징
벡터 인덱싱 (Vector Indexing):
고차원의 벡터 데이터를 인덱싱할 수 있도록 지원한다.
예: 이미지, 오디오, 문장 임베딩 등.
근접 이웃 검색 (Nearest Neighbor Search):
입력된 벡터와 가장 가까운(유사한) 벡터를 빠르게 찾아낼 수 있다.
확장 가능한 인덱스 관리 (Scalable index management):
데이터가 많아져도 성능 저하 없이 인덱스를 효율적으로 관리한다.
기능 | 설명 |
Dense Vector Field 지원 | 고차원 벡터(예: 128차원, 512차원 등)를 필드로 저장하고 검색 가능 |
Approximate k-NN (근접 이웃) 검색 지원 | 수천 ~ 수백만 개의 벡터 중에서 가장 가까운(유사한) 것들을 빠르게 찾아줌 |
ANN 알고리즘 사용 (HNSW 등) | 빠르고 효율적인 검색을 위한 근사 최근접 이웃 알고리즘 사용 |
OpenSearch 인덱스에 통합 | 기존 검색 인프라와 함께 사용 가능, 키워드+벡터 혼합 검색도 가능 |
기계 학습 임베딩과 함께 사용 | BERT, Sentence Transformers 등에서 생성한 벡터 사용 가능 |
https://docs.aws.amazon.com/opensearch-service/latest/developerguide/serverless-vector-search.html
Working with vector search collections - Amazon OpenSearch Service
Working with vector search collections The vector search collection type in OpenSearch Serverless provides a similarity search capability that is scalable and high performing. It makes it easy for you to build modern machine learning (ML) augmented search
docs.aws.amazon.com
🤔 문제
다음 중 Amazon OpenSearch Service의 기능 중, 기업이 벡터 데이터베이스 애플리케이션을 구축할 수 있게 해주는 기능은 무엇인가요?
- 객체 저장을 위한 Amazon S3와의 통합
- 지리 공간 인덱싱 및 쿼리 지원
- 확장 가능한 인덱스 관리 및 근접 이웃 검색 기능
- 스트리밍 데이터에 대한 실시간 분석 수행 능력
정답
정답. 3번
Amazon OpenSearch Service는 벡터 검색 (vector search) 기능을 지원한다.
벡터 인덱싱 (Vector Indexing): 고차원의 벡터 데이터를 인덱싱할 수 있도록 지원한다.
예: 이미지, 오디오, 문장 임베딩 등.
근접 이웃 검색 (Nearest Neighbor Search):
입력된 벡터와 가장 가까운(유사한) 벡터를 빠르게 찾아낼 수 있다.
확장 가능한 인덱스 관리 (Scalable index management):
데이터가 많아져도 성능 저하 없이 인덱스를 효율적으로 관리한다.
1번 오답
OpenSearch는 S3와 연동이 가능하지만, 이는 백업이나 스냅샷용이다. 벡터 검색과는 무관하다.
2번 오답.
지리 정보(위도/경도)를 처리할 수 있는 기능이다. 벡터 검색과는 다른 용도이다.
'클라우드(AWS) > AIF-C01' 카테고리의 다른 글
[AWS] AWS Artifact란? 쉽게 정리 (0) | 2025.05.04 |
---|---|
[AWS] 머신러닝에 'Context window'란? 쉽게 정리 (0) | 2025.05.04 |
[AWS] Bedrock에서 Foundation Model(FM)을 파인 튜닝(fine-tune)하는 방법 (0) | 2025.05.03 |
[AWS] 선형 회귀(Linear Regression) 모델 평가 지표 (MSE, RMSE, MAE) (0) | 2025.05.03 |
[AWS] Multi-modal Embedding Model란? 쉽게 정리 (0) | 2025.04.24 |