Python/Pandas

[Pandas] groupby 카테고라이징

공기반 코딩반 2024. 1. 22. 04:23
반응형
import pandas as pd

df = pd.read_csv('data/occupations.csv')

occ_groups = df.groupby('occupation')
# type(age_groupsBy)
mean_occ_groups = occ_groups.mean(numeric_only=True)
mean_occ_groups.sort_values('age')

 

 

 

직업별 여성 비율 높은 순서 구하기

import pandas as pd

df = pd.read_csv('data/occupations.csv')

# 여기에 코드를 작성하세요
# df.head()

occ_group = df.groupby('occupation')
df_male = df.loc[df['gender']=='M']
male_group = df_male.groupby('occupation')
# print(male_group.count())

df_female = df.loc[df['gender']=='F']
female_group = df_female.groupby('occupation')
# print(female_group.count())

count_occ = occ_group.count()

female_ratio_occ_by_gen = female_group.count() / count_occ
female_ratio_occ_by_gen.fillna(0, inplace=True)
female_ratio_occ_by_gen['gender'].sort_values(ascending=False)

반응형

'Python > Pandas' 카테고리의 다른 글

[Pandas] 파이 차트  (0) 2024.01.23
[Pandas] Data Merge  (0) 2024.01.22
[Pandas] 문자열 필터링  (0) 2024.01.16
[Pandas] 데이터 클리닝  (0) 2024.01.05
[Pandas] DataFrame 큰 데이터 살피기  (0) 2024.01.02