Transfer Learning (전이 학습)전이 학습 (Transfer Learning) 은 이미 학습된 모델(pre-trained model)을 활용하여 새로운 머신 러닝 모델을 구축하는 방법이다.= 기존의 모델의 성능 + 새로운 데이터로 학습시키기(새로운 모델을 처음부터 훈련,구축하는 것이 아니라, 기존에 학습된 모델을 활용하기 떄문에 성능이 좋고 빠르게 구축할 수 있다) 🐱🐶 아주 쉬운 예시기존 학습된(pre-trained) 모델= "🐱고양이"와 "🐶강아지" 이미지를 구별하는 모델 Transfer Learning 적용= "🐰토끼" 와 "🐱고양이" 이미지를 구별하는 모델 구축 Transfer Learning은 주로 두 가지 방식으로 활용한다.Fine-tuning (미세 조정)이미 학..
클라우드(AWS)
🔍 Top-K란?Top-K는 머신러닝 모델이 예측한 단어 중 상위 K개만 선택하는 방식이다.K개만 선택하도록 제한함으로써, 원하는 정보만 얻을 수 있다.즉, Top-K는 원하는 정보를 얻기위한 LLM의 출력의 하이퍼파라미터이다. ✅ 쉬운 예시 : 추천 시스템 (Recommendation) 사용자가 좋아할 가능성이 높은 Top 3개의 영화 추천 영화 추천 모델의 예측 확률 (Top-3 적용 전)🎥 "Inception" → 28%🎥 "Interstellar" → 22%🎥 "The Matrix" → 15%🎥 "The Dark Knight" → 12%🎥 "Avatar" → 10%🎥 "Titanic" → 7% 영화 추천 모델의 예측 확률 (Top-3 적용 전)1️⃣ "Inception" 🎥 → ..

머신 러닝을 처음 배울 때, 대표적인 문제 유형 2 가지를 배운다.. 1. Classification(분류) 문제Classification는 주어진 데이터를 특정 그룹(카테고리)으로 분류하는 문제를 말한다✅ 예시) 아주 쉽게 이해하기:✉️ 스팸 메일 분류 → 이메일이 스팸인지 아닌지 분류🖼️ 이미지 분류 → 사진 속 동물이 고양이인지 개인지 판별 🐱🐶데이터의 특징에 따라 다음과 같은 방식으로 분류된다.예시: "Class A = 스팸", Class B = "일반 메일" 2. Regression(회귀) 문제Regression는 주어진 데이터를 기반으로 연속적인 숫자의 값을 예측하는 문제를 말한다. ✅ 예시) 아주 쉽게 이해하기💰🏠 부동산 가격 예측 → 방 개수에 따라 가격을 예측 🌡️날씨 예측 ..

📌 머신러닝에서 Temperature란?머신러닝에서 Temperature는 주로 확률적 예측을 다룰 때 사용되는 하이퍼파라미터이다모델의 예측을 얼마나 확신할지 조절하는 값이다. Temperature를 사용하는 모델 예시Generative model, LLM(예: GPT, Claude, BERT, Gemini 등) - 출력의 다양성과 창의성 조절 가능소프트맥스(Softmax) 함수 - 분류 문제에서 각 클래스의 확률을 계산할 때 사용 ✅ Temperature의 역할📈 높은 값(예: 1): 다양한 표현과 창의적인 답변 (예측에 확신이 적어 랜덤하게 동작)📉 낮은 값(예: 0): 일관성을 가진, 예측 가능한 응답을 생성 (예측에 확신을 가지고 일관적인 동작) 📌 Temperature 예시 Temper..

Amazon SagemakerSageMaker는 머신 러닝(ML) 모델을 쉽게 학습, 구축할 수 있는 AWS의 완전관리형 서비스이다.SageMaker 뜻: 지혜로운 것을 만드는 도구– Sage: 현명한, 지혜로운 (wise) – Maker : 만드는 사람 SageMaker 주요 구성 요소SageMaker는 머신러닝 파이프라인의 다양한 단계를 관리하는 여러 도구와 서비스를 제공합니다. 🔨 SageMaker StudioSageMaker Studio는 전체적인 개발 환경(IDE)의 대시보드이다.(매우 직관적이다)머신러닝 모델을 구축, 학습, 튜닝, 배포하는 데 필요한 모든 기능을 제공한다. 🔨 SageMaker Notebooks머신러닝/데이터 분석 분야에서 거의 필수인 Jupyter 노트북Sag..
머신러닝의 분류 모델(Classification Model) 성능 지표에 대해 조사해 보았다. Classification Model (분류 모델)분류 모델 성능 평가 지표분류 모델의 성능을 평가하기 위해 다음과 같은 지표가 주로 사용된다. 1) Accuarcy (정확도) 2) Precision (정밀도) 3) Recall (재현율) 4) Confusion Matrix (오차 행렬)5) F1-score 6) ROC - AUC 1. Accuracy (정확도)Accuracy(정확도)는 아~~ 주 쉽다😁 $$ Accuracy = \frac{ 올바르게 분류한 샘플 수 }{ 전체 샘플 수 } $$🔹 예시: 100개의 샘플 중 90개를 맞췄다면, 정확도 = 90% 🔹 실제 식$$ Accuracy = \..
Decision Tree (의사 결정 트리)Decision Tree는 알고리즘이다.분류(Classification) 및 회귀(Regression) 문제를 해결하는 머신러닝(ML)에서 자주 사용된다. 데이터의 특징을 기반으로 트리 구조를 만들어 결정 규칙을 생성하고, 새로운 데이터가 주어졌을 때 적절한 클래스로 분류하거나 값을 예측하는 데 사용된다. 💪 Decision Tree 예시:날씨에 따라서 야외 운동을 할지 안할지를 정하는 Decision Tree이다.🎯 클래스 (Class)Play → 운동 가능 ✅Not Play → 운동 불가능 ❌🔹 속성 (Attribute)outlook (날씨) → sunny, overcast, rainhumidity (습도) → high, normalwindy (바람 ..

Named Entity Recognition (NER)문장에서 특정한 의미가 있는 단어들을 찾아내는 기술이다. 쉽게 말해, 문장에서 사람, 장소, 날짜, 조직 등 중요한 정보를 자동으로 식별한다. NER 예시:"Google was founded by Larry Page and Sergey Brin in 1998 in Menlo Park, California."GoogleOrganization (조직)Larry PagePerson (사람)Sergey Brin Person (사람)1998Date (날짜)Menlo ParkLocation (장소)CaliforniaLocation (장소)