클라우드(AWS)

✅ 생성형 AIUnimodal vs Multimodal구분설명예시Unimodal입력과 출력이 한 가지 종류입력: 텍스트 → 출력: 텍스트(예: 과거의 ChatGPT)Multimodal입력과 출력에서 여러 가지 종류의 데이터를 함께 처리 가능입력: 텍스트 → 출력: 이미지 생성(예: 최신의 ChatGPT: DALL·E)
Data Augmentation (데이터 증강)Data augmentation은 기존의 데이터를 약간 변형해서 새로운 데이터를 만들어내는 기술이다.이는 주로 머신러닝 모델(이미지, 자연어 처리)의 성능을 높이기 위해, 훈련시키기 위한 데이터량을 늘릴 때 사용한다 📌이해하기 위한 간단한 예시: 이미지 생성 모델학습 데이터로 남성만 포함된 "의사" 이미지 사용하면, 남자라는 편향이 생긴다.Data Augmentation를 통해 여성을 의사로 표현한 이미지 만들어 직업과 성별 간의 편향을 줄일 수 있다. 이미지 데이터 증강 방법이미지 데이터를 증강할 때 흔히 사용하는 기법:회전 (rotate)좌우 반전 (flip)확대 또는 축소 (zoom in/out)밝기 조절 (brightness adjustment)노이..
Generative AI Security Scoping MatrixGenerative AI Security Scoping Matrix는 생성형 AI(Generative AI) 솔루션을 사용할 때, 누가 어떤 보안 책임(Security responsibility)을 가지는지 정확히 구분해주는 가이드 매트릭스이다. 🔐 5가지 스코프 요약Scope이름설명보안 책임1Consumer App공개된 서드파티 AI 앱을 그냥 사용 (ex. ChatGPT)거의 없음2Enterprise App기업용 SaaS 제품에 내장된 AI 기능 사용 (ex. 회의 앱에 포함된 AI 기능)매우 낮음3Pre-trained ModelAPI로 사전 학습된 FM을 연결해서 자체 앱 개발 (ex. Bedrock API로 챗봇 개발)중간 수준4..
✅ Prompt란? Prompt는 인공지능 AI에게 무엇을 하라고 지시하는 입력 문장이다. Prompt EngineeringPrompt engineering은 AI 모델(LLM)에 제공되는 프롬프트(질문이나 입력)를 최적화하여 원하는 출력을 얻는 기술이다. 예시: 일반 프롬프트: "오늘 날씨 어때?"예시: 최적화된 프롬프트: "오늘 서울의 날씨는 어떤가요? 기온, 습도, 바람 속도 등 구체적인 정보를 알려주세요." ContextContext는 AI가 질문(Prompt)을 더 잘 이해하고 정확한 답변을 할 수 있도록 참고할 수 있는 '배경 정보'이다.("AI가 대답할 때 참고하는 상황이나 자료") 예시: 이미지 생성을 명령했을 때 참고할 만한 이미지 파일을 Context로써 첨부하기. 프롬프트 템플릿..
AWS ArtifactAWS의 컴플라이언스 관련 보고서(보안 및 규정 준수 문서)를 요청 시(on-demand) 다운로드할 수 있는 서비스이다.→ 기업이 AWS의 보안 상태와 규정 준수 수준을 쉽게 이해하고 검증할 수 있도록 도와준다 📁 제공하는 문서 예시아래와 같은 국제 인증 및 컴플라이언스 보고서를 다운로드할 수 있다:ISO (국제표준화기구) – 시큐리티/보안 관리PCI DSS (신용카드 결제 관련 보안 표준)SOC 1 / SOC 2 / SOC 3 (서비스 조직 통제 보고서)Global Financial Services Regulatory Principles – 금융Quality Management System OverviewISV(Independent Software Vendor, 독립 소프트웨어..
📌 머신러닝에서 Context window란?LLM(대형 언어 모델)이 한 번에 이해할 수 있는 입력(프롬프트) + 출력의 총 길이📌 프롬프트가 너무 길면 모델이 잘라내거나 에러 발생 → context window 크기 확인 필수 단위: 토큰(Token)어떤 모델의 context window가 4,000토큰이면 → 사용자 프롬프트 + AI 응답 합쳐서 4,000토큰까지만 다룰수 있다.예시: GPT-3.5 → 약 4,096 tokens,예시: Claude 3 → 최대 200,000 tokens 이상🧑‍💻 사용자 입력 (프롬프트):"오늘은 날씨가 참 좋아요. AI가 요즘 화제가 되고 있는데, 사람들이 많이 사용하고 있어요. 챗봇은 대화를 하고, 그림도 그리고, 글도 쓰고, 정말 다양한 일을 하죠."(..
Amazon OpenSearch Service – Vector SearchOpenSearch Service는 Vector Search (벡터 검색) 기능을 제공한다.이는 AI 및 머신러닝 기반 애플리케이션에서 유사한 데이터를 빠르게 검색할 수 있도록 도와주는 기능이다.특히 추천 시스템, 이미지 검색, 자연어 처리(NLP) 기반 검색 시스템 등에 많이 사용된다.✅ Vector Search란?일반적인 검색은 "단어" 중심의 키워드 검색 (Keyword Search)이다.벡터 검색은 데이터를 vector화(숫자 배열)하여 "비슷한 의미"를 가진 데이터를 검색한다.예시:“강아지”라는 단어와 의미적으로 비슷한 단어들(예: 애완동물, 반려견)을 찾는 데 사용됨.vector 예시"고양이" → [0.12, -0.53,..
Bedrock의 FM을 fine-tuning 하는 법파인튜닝(fine tune)은 이미 학습된 Foundation Model(FM)에 자신의 회사 데이터를 추가로 학습시켜, 더 자신의 회사에 맞는 정확한 모델로 만드는 과정이다. ✅ Bedrock에서 FM 파인튜닝하는 기본 단계 단계 설명 1️⃣ 데이터 준비(JSONL 형식으로 저장)프롬프트(prompt)와 응답(completion)이 포함된 라벨화된 데이터를 준비한다.이 데이터들을 .jsonl (JSON Lines) 형식으로 저장한다.예시: { "prompt": "고객이 배송 지연을 문의할 때", "completion": "사과하고 예상 배송일 안내" }2️⃣ S3에 업로드.jsonl 파일을 Amazon S3 버킷에 업로드3️⃣ 콘솔에서 파인튜닝 시작A..
찌르비
'클라우드(AWS)' 카테고리의 글 목록