반응형
Feature Engineering
머신러닝 모델에 입력될 데이터를 전처리(data preprocessing)하고, 새로운 feature를 생성하거나,불필요한 feature를 제거하는 작업이다.
= raw data를 feature로 전환시키는 작업
예시:텍스트에서 단어 수를 추출
예시: 날짜를 "요일", "월", "계절"로 변환

📌 Feature selection
데이터에 있는 여러 속성(특성, 변수) 중에서, 정말 모델에 도움이 되는 것들만 골라내는 과정

🧠 SageMaker Pipelines의 Processing Step
👉 SageMaker에서는 이러한 작업을 Processing Step에서 처리하면 된다.
다양한 프로세서 실행 가능 (파이썬 스크립트나 스파크 작업 사용 가능)
- SKLearnProcessor
- ScriptProcessor
- SparkProcessor
반응형
'클라우드(AWS)' 카테고리의 다른 글
| [AWS] Augmented AI (Amazon A2I)란? 쉽게 정리 (Human-Centered AI, RLHF) (0) | 2025.05.15 |
|---|---|
| [AWS] AI Service Cards와 SageMaker Model Cards란? 쉽게 정리 (responsible AI) (0) | 2025.05.15 |
| [AWS] Content Moderation란? 쉽게 정리 (Amazon Rekognition) (0) | 2025.05.15 |
| [AWS] AWS Trainium란? 쉽게 정리 (기계 학습 전용 EC2) (0) | 2025.05.13 |
| [AWS] Nitro System란? 쉽게 정리 (1) | 2025.05.12 |