코딩하는 해맑은 거북이
[데이터시각화] relplot, catplot, displot 본문
해당 글은 아래의 3가지를 다룬다.
📌 relplot
📌 catplot
📌 displot
kind 옵션 변경으로 간단하게 여러가지 plot을 그릴 수 있는 함수인 seaborn의 relplot, catplot, displot을 소개한다.
예시 데이터는 seaborn의 기본 데이터 중 자동차 연비 데이터셋인 'mpg'를 불러 사용하였다.
*참고: seaborn의 다른 기본 데이터 보러가기
import seaborn as sns
df = sns.load_dataset('mpg')
df

📌 relplot
relplot 함수는 관계형(relational) 플롯을 생성하는데 사용된다.
- scatterplot() (with kind="scatter"; the default)
- lineplot() (with kind="line")
seaborn.relplot — seaborn 0.13.0 documentation
seaborn.relplot seaborn.relplot(data=None, *, x=None, y=None, hue=None, size=None, style=None, units=None, row=None, col=None, col_wrap=None, row_order=None, col_order=None, palette=None, hue_order=None, hue_norm=None, sizes=None, size_order=None, size_nor
seaborn.pydata.org
sns.relplot(data=df, x="weight", y="mpg", kind="scatter")

sns.relplot(data=df, x="weight", y="mpg", kind="line")

📌 catplot
catplot 함수는 범주형(categorical) 데이터를 시각화하는 데 사용된다.
- Categorical scatter plots:
- stripplot() (with kind="strip"; the default)
- swarmplot() (with kind="swarm")
- Categorical distribution plots:
- boxplot() (with kind="box")
- violinplot() (with kind="violin")
- boxenplot() (with kind="boxen")
- Categorical estimate plots:
- pointplot() (with kind="point")
- barplot() (with kind="bar")
- countplot() (with kind="count")
seaborn.catplot — seaborn 0.13.0 documentation
seaborn.catplot seaborn.catplot(data=None, *, x=None, y=None, hue=None, row=None, col=None, kind='strip', estimator='mean', errorbar=('ci', 95), n_boot=1000, units=None, seed=None, order=None, hue_order=None, row_order=None, col_order=None, col_wrap=None,
seaborn.pydata.org
sns.catplot(data=df, x="origin", y="mpg", kind="strip")

sns.catplot(data=df, x="origin", y="mpg", kind="swarm", aspect=2)

sns.catplot(data=df, x="origin", y="mpg", kind="box")

sns.catplot(data=df, x="origin", y="mpg", kind="violin")

sns.catplot(data=df, x="origin", y="mpg", kind="boxen")

sns.catplot(data=df, x="origin", y="mpg", kind="point")

sns.catplot(data=df, x="origin", y="mpg", kind="bar")

sns.catplot(data=df, x="origin", kind="count")

📌 displot
displot은 분포도(distribution)를 시각화하는데 사용된다.
- histplot() (with kind="hist"; the default)
- kdeplot() (with kind="kde")
- ecdfplot() (with kind="ecdf"; univariate-only)
sns.displot(data=df, x="mpg", kind="hist")

sns.displot(data=df, x="mpg", kind="kde")

sns.displot(data=df, x="mpg", kind="ecdf")

'Data Analysis & Viz' 카테고리의 다른 글
[데이터분석] 대구 교통사고 데이터 분석하기 (0) | 2023.12.12 |
---|---|
[데이터분석] 온라인 화장품 해외 판매 분석하기 (0) | 2023.10.29 |
[데이터분석] 건강검진 데이터로 가설 검정하기 (0) | 2023.10.26 |
[데이터시각화] Jupyter, Colab에서 matplotlib 한글 폰트 설정방법 (0) | 2023.10.15 |
[데이터분석] 서울 종합병원 분포 확인하기 (0) | 2023.10.12 |