클라우드(AWS)/AIF-C01

[AWS] 머신러닝에 사용되는 데이터 유형 쉽게 정리

찌르비 2025. 4. 10. 22:47
반응형

 

📂 데이터 유형

  • 정형 데이터 (Structured Data)
  • 반정형 데이터 (Semi-structured Data)
  • 비정형 데이터 (Unstructured Data)

 

Structured Data (구조화된 데이터)

명확한 특정 구조을 가지고 있는 데이터.

주로 테이블 형식으로 정리된 데이터이다.

예시: CSV 파일, SQL 파일

 

 

Semi-structured Data (반구조화 데이터)

어느 정도 일정한 구조는 있지만, 고정된 테이블 구조가 아닌 데이터

즉, 정형 데이터와 비정형 데이터의 중간 형태이다.

예시: JSON 파일

{
  "name": "홍길동",
  "age": 30,
  "skills": ["Python", "AWS"]
}

예시: XML 파일

<person>
  <name>홍길동</name>
  <age>30</age>
</person>

 

 

Unstructured Data (비구조화 데이터)

고정된 형식이 없는 데이터

(예: 이메일, 이미지, 영상, 텍스트, SNS 포스트).

반응형