반응형

Python/Seaborn 3

[Seaborn] EDA

EDA(Exploratory Data Analysis) : 주어진 데이터를 다양한 관점에서 탐색하며 인사이트를 도출 - row의 의미 - column의 분포 - 여러 column간 연관성 기본정보 데이터 불러오기 import pandas as pd import seaborn as sns %matplotlib inline df = pd.read_csv('./data/young_survey.csv') df.head() basic_info = df.iloc[:, 140:] # 마지막 7개 column basic_info.head() - 성별 / 우세 손 / 학벌 column 요소별 갯수 basic_info['Gender'].value_counts() basic_info['Handedness'].value_co..

Python/Seaborn 2024.01.09

[Seaborn] LM Plot, Cat Plot

LM (Linear Model) sns.lmplot(data=body_df, x='Height', y='Weight' ) ※ 만약 그래프가 안 뜬다면?? 해결 1) !pip install --upgrade --ignore-installed pip setuptools : 패키지 버전 수정 해결 2) 패키지 버전 수정 !pip install clyent==1.2.2 !pip install PyYAML==6.0.1 해결 3) pip 버전 수정 !pip install -U pip Cat Plot 데이터 가져오기 import pandas as pd import seaborn as sns laptops_df = pd.read_csv('./data/laptops.csv') laptops_df.head() - OS 종..

Python/Seaborn 2024.01.08

[Seaborn] KDE

Seaborn : Statistical Data Visualization 확률밀도함수 PDF (Probability Desity Function) : 데이터 셋의 분포를 나타냄 : 특정 구간에서의 확률을 나타냄 선의 확률은 0 키가 170일 확률 = 0 KDE(Kernel Density Estimation) : 우리가 갖고 있는 데이터는 굴곡이 많은 데이터임 : KDE를 사용해 굴곡 많은 데이터를 추측을 통해 진짜 분포에 가깝게 부드러운 곡선으로 바꿀 수 있음 키 몸무게 데이터 가져오기 body_df = pd.read_csv('./data/body.csv', index_col=0) body_df.head() 데이터 정렬 body_df['Height'].value_counts().sort_index() 그..

Python/Seaborn 2024.01.05
반응형