전체 글

모델 유형 (Embedding Model)모델 예시설명📝 Text-onlyGPT, BERT, RoBERTa텍스트 생성, 이해, 요약, 번역 등🖼️ Vision-onlyResNet, ViT이미지 분류, 객체 인식 등🔊 Speech-onlyWhisper, DeepSpeech음성 인식, 음성 합성 등🧩 Multi-modalCLIP, GPT-4V, Flamingo텍스트 + 이미지/음성 동시 처리🌐 Graph-basedGCN, GAT, GraphSAGE관계형 데이터 분석 (소셜, 추천 등) 📌 Multi-modal Embedding Model란?다양한 종류의 데이터(예: 텍스트, 이미지, 오디오 등)를 입력으로 받을 수 있는 모델이에요.(데이터 종류 상관없이 embedding 할 수 있다)예시: Cha..
📌 Average Response Time (평균 응답 시간)사용자가 입력을 주었을 때, AI 모델이 결과를 반환할 때까지 걸리는 평균 시간이다.사용 예시:실시간 시스템 (예: 챗봇, 자동 응답 시스템, 음성 비서 등)인터랙티브 웹 서비스 (예: 추천 시스템, 검색엔진)모바일 애플리케이션 (예: 이미지 인식, AR 응용 프로그램)중요성:응답 시간이 길면 사용자 경험이 나빠지고, 시스템 성능이 떨어진다고 인식된다.기업 서비스의 경우, 응답 지연은 수익 손실이나 사용자 이탈로 이어질 수 있다. 🤔 문제AI 모델을 운영하는 동안의 실행 효율성(runtime efficiency) 을 측정하는 지표는 무엇인가요?고객 만족도 점수 (CSAT, Customer satisfaction score)각 에폭(epoch..
📌 모델 학습(Training)이란?머신러닝 모델은 데이터를 통해 반복적으로 학습한다.이 과정에서 가중치(Weights)라는 값을 조정한다 → 이 가중치가 바로 모델이 학습한 내용이다.모델은 가중치를 계속 조정하여 예측 결과를 정답에 가깝게 만든다.🔁 반복 학습 (Iterative Training)한 번만 학습해서는 정답을 맞추기 어려우므로, 수백~수천 번 반복하면서 오류(Error)를 줄이는 방향으로 가중치를 바꾼다. 🔧 하이퍼파라미터 튜닝 (Hyperparameter Tuning)📌 하이퍼파라미터(Hyperparameter)란?머신 러닝 모델의 구조나 학습 방식을 정하는 외부 설정 값이다.학습률 (Learning rate)에폭 수 (Epochs)미니배치 크기 (Batch size)신경망 레이..
🧪 머신러닝 파이프라인 (Machine Learning Pipeline)머신러닝 파이프라인은 비즈니스 목표 → 데이터 준비 → 모델 훈련 → 배포 → 모니터링까지 이어지는 일련의 연결된 단계들이다.머신러닝 모델을 개발하면 계속 이 파이프라인 과정을 반복하기 때문에 라이프사이클(lifecycle)이라고 하기도 한다. 🔁 머신러닝 파이프라인 주요 단계 (요약)이 과정은 지속적으로 반복된다 → 모델 성능이 떨어지면 재훈련하거나 새로운 데이터로 개선해야 된다.단계설명1. 문제 정의 (Problem Definition)비즈니스 목표를 명확히 설정 (성공 기준, 측정 가능한 목표)2. 데이터 준비 (Data Preparation)적절한 훈련 데이터 확보 (품질, 접근성, 정합성 확인)3. 모델 선택 (Model..
RAG (Retrieval-Augmented Generation)👉 뜻 그대로 해석하기Retrieval (검색): 정보를 찾아오기Augmented (보강된): 강화된, 보완된Generation (생성): 답변을 만들어내기AI가 정보를 찾아와서 보완한 뒤에 답변을 만들어내는 기술이다.AI한테 질문할 때마다, 실시간으로 외부 데이터(지식 베이스:Knowledge Base)를 가져와서 참조시킨다. LLM (대형 언어 모델) 기반 AI에서 사용된다.LLM 모델설명OpenAI GPT-4ChatGPT에 쓰이는 모델Amazon TitanAWS의 LLMAnthropic Claude대화형 AI 모델Google Gemini구글의 AI 모델 📌 RAG 필요한 이유기존의 GPT와 같은 AI 모델은 학습한 지식만 사용해서 ..
🧠 기본적인 머신러닝 용어 정리 ✅ Inference (추론)이미 학습된 머신러닝 모델에 실제 새로운 데이터를 입력해서 예측(분석)하는 것을 말한다.예시: ChatGPT에게 사진을 입력하여, 지브리 사진 만들어달라고 요청하기 ✅ Overfitting (과적합, 오버피팅)머신러닝 모델이 훈련(training) 데이터에는 제대로 작동하지만, 새로운 데이터에는 성능이 떨어지는 경우.훈련 데이터실제 데이터✅❌ 📌 주된 이유: 훈련 데이터에 있는 불필요한 특징(noise:노이즈)까지 학습해서, 다른 데이터에서는 제대로 인식하지 못한다. 📌 해결 방법:더 다양한 데이터로 훈련시키기같은 데이터로 너무 오래 훈련시키지 않기​​​✅ Underfitting (과소적합, 언더피팅)머신러닝 모델이 훈련 데이터에도, 새..
Responsible AI 핵심 요소핵심 요소설명공정성 (Fairness)AI가 특정 집단에 편향되지 않도록 해야 한다. (예: 성별, 인종, 나이 등)설명 가능성 (Explainability)AI가 왜 그런 결정을 내렸는지 사용자가 이해할 수 있어야 한다.프라이버시 및 보안 (Privacy & Security)사용자 데이터는 보호되고, 안전하게 처리되어야 한다.투명성 (Transparency)AI 시스템이 어떻게 작동하는지 명확히 공개되어야 한다.책임성 (Accountability)AI의 결정에 대해 책임질 수 있어야 하고, 문제가 생기면 수정해야 한다. https://aws.amazon.com/ai/responsible-ai/ 책임 있는 AI - 책임 있는 AI 구축 - AWS생성형 AI의 급속한 성..
🧠 딥러닝(Deep Learning)머신러닝의 한 종류이다인간의 뇌 구조와 같은 방식을 컴퓨터에게 적용시켜 학습시키는 방식이다.특히 뇌 속의 뉴런처럼, 딥러닝에서는 노드(Node)라는 구조를 만들어서 인공 신경망(Neural Network)을 사용해 학습한다. ✅ 딥러닝 모델의 구조입력층(input layer) → 여러 개의 은닉층(hidden layers) → 출력층(output layer)으로 구성각 노드는 입력값에 가중치(weight)를 곱해서 정보를 전달예측 결과와 실제 값의 차이를 계산해서, 그 오차를 줄이도록 가중치를 반복적으로 조정함 참고) Feedforward Neural Network(FNN) (순방향 신경망)여러개의 유닛으로 구성된 레이어가 다중으로 존재한 구조. 일정 방향으로 정보가..
찌르비
아주 쉽게 정리한 블로그