전체 글

·영어 공부
코드 스니펫(Code Snippet)란? ✅ Code Snippet 자주 사용하는 코드를 미리 짧은 코드 템플릿 형식으로 만들어둔것 📌 예시: Python에서 파일 열기 위한 Code Snippet with open("file.txt", "r") as file: content = file.read()이런 코드를 사용할 때마다 매번 치기 귀찮기 때문 Code Snippet 형식으로 미리 저장. 예시) for만 치면 → for loop 코드 자동 완성예시) if만 치면 → 조건문 자동 생성
특징SLMLLM Small Language ModelLarge Language Model⚙️매개변수 (parameter)수백만 개 이하수십억~수천억 개📈성능특정 작업에 초점을 둔다(예: 문서 분류, 간단한 자연어 처리).복잡한 작업에서 우수한 성능 제공.(문맥 이해, 텍스트 생성, 번역 등)💰비용 (cost) 낮은 계산 자원과 메모리 요구 사항높은 계산 자원과 GPU/TPU 메모리 필요  SLM (Small Language Model)작은 규모의 언어 모델로, 주로 경량화되어 빠른 응답 속도와 낮은 리소스 사용량이 특징이다.보통 엣지 디바이스(edge device) 또는 특정 도메인에 최적화된 모델로 사용된다. SLM 예시DistilBERT: BERT의 경량화 버전 (약 40% 적은 파라미터, 속도는..
Amazon Q in QuickSightAmazon Q in QuickSight는 Amazon QuickSight Q의 기능을 확장한 업그레이드 버전Amazon QuickSight Q       ...2021년 9월 출시​Amazon Q in QuickSight   ... 2023년 12월 출시  Amazon QuickSight QQuickSight Q는 자연어로 데이터를 질의(Query)할 수 있는 기능을 제공하는 비즈니스 인텔리전스(BI) 도구이다.즉, 단순한 질문으로 데이터를 쉽게 분석하고 시각화할 수 있는 기능이다. ✅ 자연어 질문 지원 (NLQ, Natural Language Query): 사용자가 SQL 없이 자연어로 질문가능(👨‍🏫예시): "지난달 매출은 얼마야?" 라고 질문하면, 자동으..
Amazon BedrockBedrock는 AWS에서 제공하는 Generative AI 서비스로, 다양한 기반 모델(예시: Anthropic Claude, AI21 Labs, Stability AI, Cohere, Amazon Titan) 을 활용하여 AI 애플리케이션을 손쉽게 구축할 수 있다. AWS re:Invent 2022(2022년 11월)에서 공식적으로 발표되었다 Bedrock의 사전적 의미1) "기반암" : 지구 표면 아래에 있는 단단한 암석층2) "기초, 근본" :(비유적 의미) 어떤 것의 기초, 근본, 핵심 원칙예: "Trust is the bedrock of a good relationship." → "신뢰는 좋은 관계의 근본(기초)이다."  Bedrock 특징📌다양한 Generative..
Amazon SageMaker Ground Truth Plus2020년 AWS re:Invent 2020에서 처음 출시 발표된 서비스SageMaker Ground Truth Plus는 머신 러닝 모델의 학습 데이터를 사람이 직접 데이터 라벨링 관리할 수 있는 서비스이다.이를 통해, 데이터의 퀄리티를 높일 수 있다.(Amazon SageMaker Ground Truth의 확장 버전이다)  👨‍🏫 Human-in-the-loop (사람 개입)자동 라벨링과 사람의 검토를 통해 데이터 라벨링을 더 정확하게 관리할 수 있다.잘못된 라벨링이나 어려운 데이터를 수정하고, 모델의 성능을 향상시킬 수 있다. [AWS Console]SageMaker → Ground Truth → Ground Truth Plus 선택 ..
Transfer Learning (전이 학습)전이 학습 (Transfer Learning) 은 이미 학습된 모델(pre-trained model)을 활용하여 새로운 머신 러닝 모델을 구축하는 방법이다.= 기존의 모델의 성능 + 새로운 데이터로 학습시키기(새로운 모델을 처음부터 훈련,구축하는 것이 아니라, 기존에 학습된 모델을 활용하기 떄문에 성능이 좋고 빠르게 구축할 수 있다)  🐱🐶 아주 쉬운 예시기존 학습된(pre-trained) 모델= "🐱고양이"와 "🐶강아지" 이미지를 구별하는 모델 Transfer Learning 적용= "🐰토끼" 와 "🐱고양이" 이미지를 구별하는 모델 구축   Transfer Learning은 주로 두 가지 방식으로 활용한다.Fine-tuning (미세 조정)이미 학..
🔍 Top-K란?Top-K는 머신러닝 모델이 예측한 단어 중 상위 K개만 선택하는 방식이다.K개만 선택하도록 제한함으로써, 원하는 정보만 얻을 수 있다.즉, Top-K는 원하는 정보를 얻기위한 LLM의 출력의 하이퍼파라미터이다.  ✅ 쉬운 예시 :  추천 시스템 (Recommendation) 사용자가 좋아할 가능성이 높은 Top 3개의 영화 추천 영화 추천 모델의 예측 확률 (Top-3 적용 전)🎥 "Inception" → 28%🎥 "Interstellar" → 22%🎥 "The Matrix" → 15%🎥 "The Dark Knight" → 12%🎥 "Avatar" → 10%🎥 "Titanic" → 7% 영화 추천 모델의 예측 확률 (Top-3 적용 전)1️⃣ "Inception" 🎥 → ..
머신 러닝을 처음 배울 때, 대표적인 문제 유형 2 가지를 배운다.. 1. Classification(분류) 문제Classification는 주어진 데이터를 특정 그룹(카테고리)으로 분류하는 문제를 말한다✅ 예시) 아주 쉽게 이해하기:✉️ 스팸 메일 분류 → 이메일이 스팸인지 아닌지 분류🖼️ 이미지 분류 → 사진 속 동물이 고양이인지 개인지 판별 🐱🐶데이터의 특징에 따라 다음과 같은 방식으로 분류된다.예시: "Class A = 스팸", Class B = "일반 메일"  2. Regression(회귀) 문제Regression는 주어진 데이터를 기반으로 연속적인 숫자의 값을 예측하는 문제를 말한다. ✅ 예시) 아주 쉽게 이해하기💰🏠 부동산 가격 예측 → 방 개수에 따라 가격을 예측 🌡️날씨 예측 ..