개발하는 자몽

데이터의 분류 본문

Database

데이터의 분류

jaamong 2022. 1. 9. 09:15

나에게 맞는 데이터를 수집하기 위해서는 먼저 수집 대상이 되는 데이터의 유형을 파악하고 있어야 한다. 일반적으로 데이터는 형태에 따라 정형 데이터, 반정형 데이터, 비정형 데이터로 분류할 수 있다.

 

정형 데이터(structured data)

  • 구조화된 데이터, 즉 미리 정해진 구조(schema)에 따라 저장된 데이터
  • 예시
    • 엑셀의 스프레드 시트, 관계 데이터베이스의 테이블 : 표 안에서 행과 열에 의해 지정된 각 칸에 데이터를 저장

 

반정형 데이터(semi-structured data)

  • 구조에 따라 저장된 데이터이지만 정형 데이터와 달리 데이터 내용 안에 구조에 대한 설명이 함께 존재함
  • 데이터 내용에 대한 설명, 즉 구조를 파악하는 파싱(parsing) 과정 필요
  • 보통 파일 형태로 저장됨
  • 웹에서 데이터를 교환하기 위해 작성하는 HTML, XML, JSON 문서나 웹 로그, 센서 데이터 등이 속함

 

NOTE - 내용과 함께 설명된 데이터 구조를 스키마(schema)라고도 하지만 메타 데이터(metadata)라고도 한다.

 

 

비정형 데이터(unstructured data)

  • 정해진 구조가 없이 저장된 데이터
  • 소셜 데이터의 텍스트, 영상, 이미지, 워드, PDF 문서와 같은 멀티미디어 데이터

 

같이 보면 좋은 포스트

 

3. 데이터베이스 시스템

데이터베이스의 원리와 응용 본 강의에서는 데이터베이스 입문자들에게 꼭 필요한 데이터베이스 기초 이론, 데이터 모델과 연산, SQL, 데이터베이스 설계에 대해 공부하고자 한다. www.kocw.net 위

backend-jaamong.tistory.com

 

 

출처

김연희, 『데이터베이스 개론』, 한빛아카데미(2019), p26-27.

'Database' 카테고리의 다른 글

개념적 데이터 모델링: 실습  (0) 2022.01.13
4. 개념적 데이터 모델링  (1) 2022.01.12
3. 데이터베이스 시스템  (0) 2022.01.09
2. 데이터베이스 관리 시스템  (0) 2022.01.08
1. 데이터베이스 기본 개념  (0) 2022.01.05
Comments