코딩하는 해맑은 거북이

[데이터시각화] 시각화의 요소 본문

Data Analysis & Viz

[데이터시각화] 시각화의 요소

#CJE 2023. 3. 21.
본 게시물의 내용은 '부스트캠프 AI Tech - Data Visualization(안수빈)' 강의를 듣고 작성하였다.
해당 글은 아래의 2가지를 다룬다.
1. 데이터 이해하기
2. 시각화 이해하기

 

1. 데이터 이해하기

🍀 시각화할 진행할 데이터

  1) 데이터셋 관점 (global)

  2) 개별 데이터의 관점 (local)

 

🍀 데이터셋 종류 6가지

1) 정형 데이터

- 테이블 형태로 제공되는 데이터, 일반적으로 csv, tsv 파일로 제공

* Row : 데이터 1개 item

* Column : attribute (feature)

- 가장 쉽게 시각화할 수 있는 데이터셋 (통계적 특성과 feature 사이 관계 / 데이터 간 관계 / 데이터 간 비교)

 

2) 시계열 데이터

- 시간 흐름에 따른 데이터를 Time-Series 라고 한다.

- 기온, 주가 등 정형데이터와 음성, 비디오와 같은 비정형 데이터 존재
- 시간 흐름에 따른 추세(Trend), 계절성(Seasonality), 주기성(Cycle) 등을 살필 수 있다.

 

3) 지리/지도 데이터

- 지도 정보와 보고자 하는 정보 간의 조화 중요 + 지도 정보를 단순화 시키는 경우도 존재
- 거리, 경로, 분포 등 다양한 실사용

 

4) 관계형(네트워크) 데이터

- 객체와 객체 간의 관계를 시각화 (Graph visualization / Network Visualization)
- 객체는 Node로, 관계는 Link로 / 크기, 색, 수 등으로 객체와 관계의 가중치를 표현
- 노드 배치를 구성할 때 휴리스틱을 많이 사용한다.

 

5) 계층적 데이터

- 관계 중에서도 포함관계가 분명한 데이터
- 네트워크 시각화로도 표현 가능하다.
- Tree, Treemap, Sunburst 등이 대표적이다.

 

6) 다양한 비정형 데이터

 

🍀 데이터의 종류

대표적으로 4가지로 분류된다.

  • 수치형(numerical)
    • 연속형 (continuous) : 길이, 무게, 온도 등
    • 이산형 (discrete) : 주사위 눈금, 사람 수 등
  • 범주형(categorical)
    • 명목형 (norminal) : 혈액형, 종교 등
    • 순서형 (ordinal) : 학년, 별점, 등급 등

 

2. 시각화 이해하기

🍀 Mark : 그래픽 이미지에서 가장 기본적인 요소인 점, 선, 면을 의미한다.

🍀 Channel : 각 Mark를 변경할 수 있는 요소들

 

 

🍀 Pre-attentive Attribute (전주의적 속성)

- 주의를 주지 않아도 인지하게 되는 요소

ex) 길이나 기울기 등이 하나 다르면 딱 인지하게 되는 것.

- 동시에 사용하면 인지하기 어려움

- 적절하게 사용해서 시각적으로 잘 분리되는 것을 시각적 분리(visual pop-out) 이라 한다.

→ visual pop-out이 잘일어나는 시각화가 가독성↑, 전달력↑

 

'Data Analysis & Viz' 카테고리의 다른 글

[데이터시각화] Text  (0) 2023.03.22
[데이터시각화] Scatter Plot  (0) 2023.03.22
[데이터시각화] Line Plot  (0) 2023.03.22
[데이터시각화] Bar Plot  (0) 2023.03.22
[데이터시각화] Matplotlib  (0) 2023.03.21
Comments