클라우드(AWS)/AIF-C01
[AWS] 머신러닝에 사용되는 데이터 유형 쉽게 정리
찌르비
2025. 4. 10. 22:47
반응형
📂 데이터 유형
- 정형 데이터 (Structured Data)
- 반정형 데이터 (Semi-structured Data)
- 비정형 데이터 (Unstructured Data)
Structured Data (구조화된 데이터)
명확한 특정 구조을 가지고 있는 데이터.
주로 테이블 형식으로 정리된 데이터이다.
예시: CSV 파일, SQL 파일
Semi-structured Data (반구조화 데이터)
어느 정도 일정한 구조는 있지만, 고정된 테이블 구조가 아닌 데이터
즉, 정형 데이터와 비정형 데이터의 중간 형태이다.
예시: JSON 파일
{
"name": "홍길동",
"age": 30,
"skills": ["Python", "AWS"]
}
예시: XML 파일
<person>
<name>홍길동</name>
<age>30</age>
</person>
Unstructured Data (비구조화 데이터)
고정된 형식이 없는 데이터
(예: 이메일, 이미지, 영상, 텍스트, SNS 포스트).
반응형