분류 전체보기

Continued Pre-training (계속된 사전학습)기존에 학습된 큰 언어 모델(FM)을 특정 분야에 맞게 더 학습시키는 것이 과정에서는 레이블(정답) 없는 데이터셋도 사용할 수 있다. Continued Pre-training과 Fine-tuning의 차이 Continued Pre-trainingFine-tuning데이터 유형레이블 없는 대규모 데이터 (unlabeled data)레이블 있는 데이터 (labeled data)
Human-Centered AI인간 중심 AI는 AI 시스템을 설계할 때 인간의 요구와 가치를 우선시하는 접근 방식이다.이 과정에서는 심리학자, 윤리학자, 도메인 전문가 등 다양한 분야의 전문가들이 협력하여 AI 시스템이 투명하고 설명 가능하며 공정하고 비편향적이도록 만든다. Amazon Augmented AI AI의 결과를 사람이 검토하거나 수정할 수 있도록 돕는 AWS 서비스이다.AI가 처리한 작업이 100퍼센트 정확하지 않기 때문에, 사람이 결과를 review하여 확인하거나 수정해야 한다.사람이 함께 참여하는 "augmented AI" 방식이다. RLHF (사람의 피드백을 이용한 강화 학습)RLHF는 LLM이 사실적이고 유익하며 무해한 콘텐츠를 생성하도록 돕는 기법이다.사람들이 여러 답변을 평..
AWS AI Service CardsAWS가 제공하는 AI 서비스의 핵심 정보를 적어둔 카드 형태의 안내서 (Responsible AI 고려 사항)AWS AI 서비스의 주요 기능, 특징, 가격, 사용 사례(use case), 한계(limitation) 등을 간단하고 직관적으로 요약해서 보여주는 자료이다.배포 방법과 성능 최적화에 대한 설명도 있다.Amazon TranscribeAmazon Titan TextAmazon RekognitionAmazon ComprehendAmazon Polly 등AWS의 AI 모델만 다룬다. 오픈소스나 서드파티(타사)의 모델은 설명하지 않습니다. 예시: Chatgpt, Perplexity SageMaker Model CardsSageMaker 모델 카드는 모델의 생애 주기(..
Feature Engineering머신러닝 모델에 입력될 데이터를 전처리(data preprocessing)하고, 새로운 feature를 생성하거나,불필요한 feature를 제거하는 작업이다.= raw data를 feature로 전환시키는 작업 예시:텍스트에서 단어 수를 추출예시: 날짜를 "요일", "월", "계절"로 변환 📌 Feature selection데이터에 있는 여러 속성(특성, 변수) 중에서, 정말 모델에 도움이 되는 것들만 골라내는 과정 🧠 SageMaker Pipelines의 Processing Step👉 SageMaker에서는 이러한 작업을 Processing Step에서 처리하면 된다.다양한 프로세서 실행 가능 (파이썬 스크립트나 스파크 작업 사용 가능)SKLearnProces..
·클라우드(AWS)
Content Moderation웹사이트, 소셜 미디어등 온라인에 올라오는 글, 이미지, 영상이 규칙을 지키는지 확인하고 관리하는 것이다.부적절하거나 위험한 콘텐츠가 플랫폼에 게시되지 않도록 필터링하거나 제거하는 것이 목적이다. 예시: 욕설, 혐오 발언, 음란물, 폭력적인 이미지 또는 영상, 허위 정보, 스팸, 사기성 광고 등 Amazon RekognitionAWS에는 머신러닝 기반 콘텐츠 모더레이션 서비스인 Amazon Rekognition이 있다.Amazon Rekognition은 이미지나 영상에서 음란물, 폭력, 불쾌한 콘텐츠 등을 자동 탐지할 수 있다.Amazon Rekognition은 주로 이미지에서 무엇가를 탐치하는데 사용한다.
✅ AWS EC2 인스턴스 시리즈 정리시리즈주요 용도설명T 시리즈 (t3, t4g)범용, 저비용CPU 버스트 가능한 저렴한 범용 인스턴스. 웹 서버, 개발/테스트에 적합M 시리즈 (m6i, m7g)범용, 균형형CPU, 메모리 균형형. 다양한 앱에 적합 (웹앱, 백엔드 서버 등)C 시리즈 (c7g, c7i)컴퓨팅 최적화CPU 계산 많은 작업에 적합. 게임 서버, 배치 처리, HPC 등R 시리즈 (r7g, r6i)메모리 최적화RAM 많이 쓰는 워크로드에 적합. 데이터베이스, 캐시 서버 등X 시리즈 (x2idn)고메모리초고용량 메모리. SAP HANA, 대형 인메모리 DB에 적합G 시리즈 (g4dn, g5)그래픽/AI 추론GPU 기반. 게임 스트리밍, VDI, 머신러닝 추론에 적합P 시리즈 (p4d, p5)딥..
·클라우드(AWS)
AWS Nitro SystemEC2 인스턴스의 고성능과 보안을 향상시키는 전용 하드웨어와 소프트웨어 시스템이다 2017년 11월에 출시 (2013년부터 개발 시작)구성 요소: 전용 하드웨어와 소프트웨어하이퍼바이저: AWS 커스텀 하이퍼바이저 사용새로운 인스턴스: Nitro 기반으로 론칭됨장점: AWS 측에서 더 빠르고 효율적인 업데이트 가능 (Nitro System은 사용자가 따로 설정할 필요가 없다. 기본적으로 모든 EC2 인스턴스에 내장되어 있다)성능 향상: 가상화 오버헤드를 최소화하여 EC2 인스턴스가 더 빠르고 효율적으로 작동보안 강화: 하드웨어 수준에서 보안 기능을 제공하여 데이터와 애플리케이션을 안전하게 보호관리 용이성: 고객이 별도의 하드웨어 관리 없이 EC2 인스턴스를 쉽게 사용할 수 있게..
📏 모델 평가 지표생성형 AI 모델의 평가는 일반 ML보다 더 어렵다. 왜냐하면, 생성 결과가 비결정적(매번 다름)이기 때문이다. 📍전통적 ML에서 사용되는 지표:Accuracy (정확도)RMSE (루트 평균 제곱 오차) https://jibinary.tistory.com/741#google_vignette [AWS] 선형 회귀(Linear Regression) 모델 평가 지표 (MSE, RMSE, MAE)Linear Regression📈 선형 회귀 모델 평가 지표지도 학습(Supervised Learning) 방식 중 하나인 선형 회귀 모델 🧮 Mean Squared Error (MSE)"예측 값"과 "실제 값" 사이의 차이(오차)를 제곱해서 평균낸 값이다.yₖjibinary.tistory.co..
찌르비
'분류 전체보기' 카테고리의 글 목록