반응형

pandas 15

[Pandas] DataFrame 인덱싱

loc 사용 import pandas as pd iphone_df = pd.read_csv('./data/iphone.csv', index_col=0) print(iphone_df.loc['iPhone 8', '메모리']) # [row, column] print(iphone_df.loc['iPhone 8', '가격']) # 존재하지 않는 column 이면 오류 Column 정보 접근 print(iphone_df.loc['iPhone X', :]) # 모든 column 정보 출력 print() print(iphone_df.loc['iPhone X']) # 모든 column 정보 출력 print(type(iphone_df.loc['iPhone X'])) # 시리즈 데이터 pandas 1차원 데이터 - typ..

Python/Pandas 2023.12.29

[Pandas] DataFrame이란?

DataFrame 표 형식의 데이터 2차원 형태의 데이터를 다루기 위한 자료형(대부분의 자료는 2차원 형태임) 행(Row/Index) : 레코드 , 열(Column) : 데이터 특징 Numpy와의 차이점 Pandas는 Numpy를 기반으로 만들어짐 Numpy + 행/열에 이름 붙이기 기능(문자열, 숫자 다가능 : 다양한 자료형) Pandas vs Numpy import pandas as pd import numpy as np two_dimensional_list = [['dongwook', 50, 85], ['sineui', 89, 31], ['iljoong', 68, 91], ['yoonseo', 88, 75]] print(np.array([two_dimensional_list])) df = pd.Da..

Python/Pandas 2023.12.26

[Pandas] Pandas vs R

R은 기존에 DataScience 분야에서 많이 써온 툴이었음. R은 데이터 분석의 도구가 잘 갖춰져 있었음 (데이터 보관/정리/분석) 이를 파이썬이 Pandas 라이브러리로 복제함 기존 파이썬은 다양한 분야에서 써오던 툴로써, 데이터를 다루는 것 까지 용이 → 인기 많아짐 Pandas 기능 외부데이터를 읽고 쓰기 정리된 데이터를 새로운 파일에 저장 데이터 시각화 표 형식의 데이터를 다루기 용이

Python/Pandas 2023.12.25

Pandas

Pandas : 구조화된 데이터를 효과적으로 처리하고 저장 : Array 계산에 특화된 NumPy를 기반으로 설계 Series : numpy의 array가 보강된 형태 : Data와 Index를 가지고 있음 Series는 값을 ndarray형태로 가지고 있음 print(type(data)) --> print(type(data.values)) --> dtype인자로 데이터 타입을 지정할 수 있음 data = pd.Series([1, 2, 3, 4], dtype = "float") print(data.dtype) --> float64 인덱스를 지정할 수 있고 인덱스로 접근 가능 data = pd.Series([1, 2, 3, 4], index = ['a', 'b', 'c', 'd']) data['c'] = ..

AI 2022.09.10
반응형