[ML] 머신러닝 문제 유형 (분류와 회귀 문제: Classification, Regression)
머신 러닝을 처음 배울 때, 대표적인 문제 유형 2 가지를 배운다..
🧠 요약 정리
학습 유형 | 문제 | 예시 |
지도 학습 | Classification: 분류 (이진/다중) | 이메일 스팸 여부, 암 유무, 문서 주제 분류 |
지도 학습 | Regression: 회귀 | 집값 예측, 키 예측 |
1. Classification(분류) 문제
Classification는 주어진 데이터를 특정 그룹(카테고리)으로 분류하는 문제를 말한다
✅ 예시) 아주 쉽게 이해하기:
✉️ 스팸 메일 분류 → 이메일이 스팸인지 아닌지 분류
🖼️ 이미지 분류 → 사진 속 동물이 고양이인지 개인지 판별 🐱🐶
데이터의 특징에 따라 다음과 같은 방식으로 분류된다.
예시: "Class A = 스팸", Class B = "일반 메일"
2. Regression(회귀) 문제
Regression는 주어진 데이터를 기반으로 연속적인 숫자의 값(수치)을 예측하는 문제를 말한다.
✅ 예시) 아주 쉽게 이해하기
💰🏠 부동산 가격 예측 → 방 수, 욕실 수, 평수 등을 이용한 가격 예측 (다중 선형 회귀)
🌡️키 예측 → 체중을 이용해서 키 예측 (단순 선형 회귀)
참고:
선형 회귀(linear regression): 숫자 예측
로지스틱 회귀(logistic regression): 어떤 일이 일어날 확률 예측 (예: 질병 발병 확률, 사기 확률)
예시: 방 개수가 많아질수록 가격이 상승