Python/Pandas

[Pandas] 문자열 필터링

공기반 코딩반 2024. 1. 16. 02:52
반응형

 

 

 

데이터 컬럼 출력

df['Genre'].unique()

 

 

 

문자열 포함 데이터 출력

 

df[df['Genre'].str.contains('Blues')]

 

 

 

특정 문자열로 시작하는 데이터 출력

df[df['Genre'].str.startswith('Blues')]

 

 

 

새로운 열에 값 넣기

df['Contains Blue'] = df[df['Genre'].str.contains('Blues')]

 

 

 

 

 


 

 

 

 

문자열 쪼개기

address = df['소재도로명주소'].str.split(n=1, expand=True)

 

 

 

df['관할구역'] = address[0]

 

 

 

 

import pandas as pd

df = pd.read_csv('data/museum_2.csv')

phone_number = df['운영기관전화번호'].str.split(pat='-', n=2, expand=True)
df['지역번호'] = phone_number[0]

df

 

 

 

 

 

 

 


 

 

카테고리 분류

데이터 불러오기

df = pd.read_csv('./data/laptops.csv')
df.head()

 

 

 

 

 

국가 브랜드 분류

# 카테고리 분류
brand_nation = {
    'Dell' : 'U.S',
    'Apple' : 'U.S',
    'Acer' : 'U.S',
    'HP' : 'U.S',
    'Lenovo' : 'China',
    'Alienware' : 'U.S',
    'Microsoft' : 'U.S',
    'Asus' : 'Taiwan'
}

 

 

새로운 컬럼에 mapping값 넣기

df['brand_nation'] = df['brand'].map(brand_nation)
# brand_nation의 왼쪽 값들을 오른쪽 값들로 변경
df.head(100)

반응형

'Python > Pandas' 카테고리의 다른 글

[Pandas] Data Merge  (0) 2024.01.22
[Pandas] groupby 카테고라이징  (0) 2024.01.22
[Pandas] 데이터 클리닝  (0) 2024.01.05
[Pandas] DataFrame 큰 데이터 살피기  (0) 2024.01.02
[Pandas] DataFrame index/column  (2) 2024.01.02