목록Data Analysis & Viz (21)
코딩하는 해맑은 거북이

해당 글은 아래의 3가지를 다룬다. 📌 relplot 📌 catplot 📌 displot kind 옵션 변경으로 간단하게 여러가지 plot을 그릴 수 있는 함수인 seaborn의 relplot, catplot, displot을 소개한다. 예시 데이터는 seaborn의 기본 데이터 중 자동차 연비 데이터셋인 'mpg'를 불러 사용하였다. *참고: seaborn의 다른 기본 데이터 보러가기import seaborn as sns df = sns.load_dataset('mpg') df 📌 relplotrelplot 함수는 관계형(relational) 플롯을 생성하는데 사용된다.scatterplot() (with kind="scatter"; the default)lineplot() (with kind="line..

본 게시물의 내용은 데이콘의 '대구 교통사고 피해 예측 AI 경진대회'에 참여하여 데이터를 분석해본 결과 일부를 기록한 것이다. 해당 글은 아래의 내용을 다룬다. 📢 사용 데이터셋 정보 💡 데이터 로드 및 확인하기 💡 데이터 요약정보 살펴보기 💡 결측치 확인하기 💡 데이터 전처리하기 💡 외부데이터 가져오기 💡 데이터 시각화 및 인사이트 도출 🎈 Github 📢 사용 데이터셋 정보 데이콘(Dacon)의 '대구 교통사고 피해 예측 AI 경진대회'의 대구에서 발생한 교통사고 데이터셋을 사용하였다. 대구 교통사고 피해 예측 AI 경진대회 - DACON 분석시각화 대회 코드 공유 게시물은 내용 확인 후 좋아요(투표) 가능합니다. dacon.io 해당 대회에서는 시고 발생 시간, 공간 등의 시공간 정보를 활용하여 ..

본 게시물의 내용은 '[코칭스터디 13기] Data Science 2023 → 파이썬으로 시작하는 데이터 사이언스(박조은)' 강의를 듣고 기존에 사용한 데이터 대신 최신 데이터를 사용해 분석하여 작성하였다. 해당 글은 아래의 내용을 다룬다. 📢 사용 데이터셋 정보 💡 데이터 로드하기 💡 데이터 미리보기 💡 데이터 요약정보 살펴보기 💡 데이터 전처리하기 ✔️ drop ✔️ melt ✔️ map & apply ✔️ astype & replace ✔️ !=, &, dropna 💡 데이터 시각화 하기 ✔️ lineplot & relplot ✔️ pivot_table & heatmap ✔️ barplot 📢 사용 데이터셋 정보 국가통계포털(KOSIS)의 '지역별/상품군별 온라인쇼핑 해외직접판매액의 2017년 1분..

본 게시물의 내용은 '[코칭스터디 13기] Data Science 2023 → 파이썬으로 시작하는 데이터 사이언스(박조은)' 강의를 듣고 작성하였다. 해당 글은 아래의 내용을 다룬다. 📢 사용 데이터셋 정보 💡 데이터 로드하기 💡 데이터 미리보기 💡 데이터 요약정보 살펴보기 💡 결측치 확인하기 💡 일부 데이터 기초통계값 확인하기 💡 일부 데이터 값 집계하기 ✔️ value_counts ✔️ groupby ✔️ pivot_table 💡 전체 데이터 시각화 하기 ✔️ hist - 히스토그램 💡 샘플 데이터 시각화 하기 🪄 샘플 데이터 추출하기 🪄 범주형 데이터 시각화 ✔️ countplot ✔️ barplot ✔️ lineplot ✔️ pointplot ✔️ boxplot ✔️ violinplot ✔️ sw..
Jupyter Notebook과 Colab에서 plot을 그릴 때, 한글이 깨져서 나오는 경우가 있다. 이때, 아래와 같이 한글 폰트를 설정해주면 해결할 수 있다. 📌 Jupyter Notebook 1. Window import matplotlib.pyplot as plt plt.rc('font', family='Malgun Gothic') 2. Mac import matplotlib.pyplot as plt plt.rc('font', family='AppleGothic') * (선택) 추가적으로 한글 폰트를 사용하면 minus font가 깨지는 경우가 있기에 unicode_minus를 False로 설정한다. plt.rc('axes', unicode_minus=False) 📌 Colab 폰트를 지정해서 ..

본 게시물의 내용은 '[코칭스터디 13기] Data Science 2023 → 파이썬으로 시작하는 데이터 사이언스(박조은)' 강의를 듣고 작성하였다. 해당 글은 아래의 내용을 다룬다. 📢 사용 데이터셋 정보 💡 데이터 로드하기 💡 데이터 미리보기 💡 데이터 요약정보 살펴보기 💡 결측치 확인하고 제거하기 💡 기초통계값 확인하기 💡 데이터 색인하기 💡 Folium으로 지도 활용하기 📢 사용 데이터셋 정보 공공데이터 포털의 '소상공인시장진흥공단_상가(상권)정보'의 의료기관만 모여져 있는 '상가(상권)정보_의료기관_201909.csv' 사용 소상공인시장진흥공단_상가(상권)정보_20230930 영업 중인 전국 상가업소 데이터를 제공합니다. (상호명, 업종코드, 업종명, 지번주소, 도로명주소, 경도, 위도 등) [..