반응형

Python 11

[Pandas] DataFrame 값 쓰기 및 삭제

데이터 row 값 추가 iphone_df.loc['iPhone XR'] = ['2018-01-25', 6.1, '3GB', 'ios 12.0.1', 'Yes'] print(iphone_df, end='\n\n') 데이터 column 추가 iphone_df['제조사'] = 'Apple' print(iphone_df, end='\n\n') 데이터 row 삭제 iphone_df.drop('iPhone XS', axis='index', inplace=False) # row 삭제 print(iphone_df, end='\n\n') - inplace=True인 경우 - inplace=False인 경우 -- 원본 데이터 안바뀜 데이터 column 삭제 iphone_df.drop('제조사', axis='columns'..

Python/Pandas 2024.01.01

[Pandas] DataFrame 값 쓰기

특정 데이터 값(행, 열) 바꾸기 ##### DataFrame 값 쓰기 iphone_df.loc['iPhone 8', '메모리'] = '2.5GB' print(iphone_df, end='\n\n') 하나의 column의 모든 값 바꾸기 # 하나의 열 값 바꾸기 iphone_df.loc['iPhone 8'] = ['2016-09-22', '4.7', '2GB', 'iOS 11.0', 'No'] print(iphone_df) 리스트로 하나의 column의 값 전체를 바꿈 # 열 값 바꿈 (리스트) iphone_df['디스플레이'] = ['4.7in', '5.5in', '4.7in', '5.5in', '5.8in', '5.8in', '6.5in'] print(iphone_df, end='\n\n') 특정 값..

Python/Pandas 2023.12.31

[Pandas] DataFrame 인덱싱

loc 사용 import pandas as pd iphone_df = pd.read_csv('./data/iphone.csv', index_col=0) print(iphone_df.loc['iPhone 8', '메모리']) # [row, column] print(iphone_df.loc['iPhone 8', '가격']) # 존재하지 않는 column 이면 오류 Column 정보 접근 print(iphone_df.loc['iPhone X', :]) # 모든 column 정보 출력 print() print(iphone_df.loc['iPhone X']) # 모든 column 정보 출력 print(type(iphone_df.loc['iPhone X'])) # 시리즈 데이터 pandas 1차원 데이터 - typ..

Python/Pandas 2023.12.29

[Pandas] Pandas vs R

R은 기존에 DataScience 분야에서 많이 써온 툴이었음. R은 데이터 분석의 도구가 잘 갖춰져 있었음 (데이터 보관/정리/분석) 이를 파이썬이 Pandas 라이브러리로 복제함 기존 파이썬은 다양한 분야에서 써오던 툴로써, 데이터를 다루는 것 까지 용이 → 인기 많아짐 Pandas 기능 외부데이터를 읽고 쓰기 정리된 데이터를 새로운 파일에 저장 데이터 시각화 표 형식의 데이터를 다루기 용이

Python/Pandas 2023.12.25

[Numpy] Python List vs Numpy Array

덧셈의 경우 Numpy : 덧셈 수행 List : 이어 붙이기 성능 Numpy 간단한 문법, 뛰어난 성능 수치 계산이 많고 복잡할 떄 행렬 같은 다차원 배열의 경우 사용 List 값을 추가하고 제거하는 일 성능 차이 발생 이유 : 값이 저장되는 방식의 차이 Numpy : 같은 자료형만 저장 가능 List : 여러 자료형 저장 가능 numpy 통계 함수 최대 최소 import numpy as np array1 = np.array([14, 6, 13, 21, 23, 31, 9, 5]) print(array1.max()) # 최댓값 print(array1.min()) # 최솟값 # 31 # 5 평균 import numpy as np array1 = np.array([14, 6, 13, 21, 23, 31, 9..

Python/Numpy 2023.12.25

Pandas

Pandas : 구조화된 데이터를 효과적으로 처리하고 저장 : Array 계산에 특화된 NumPy를 기반으로 설계 Series : numpy의 array가 보강된 형태 : Data와 Index를 가지고 있음 Series는 값을 ndarray형태로 가지고 있음 print(type(data)) --> print(type(data.values)) --> dtype인자로 데이터 타입을 지정할 수 있음 data = pd.Series([1, 2, 3, 4], dtype = "float") print(data.dtype) --> float64 인덱스를 지정할 수 있고 인덱스로 접근 가능 data = pd.Series([1, 2, 3, 4], index = ['a', 'b', 'c', 'd']) data['c'] = ..

AI 2022.09.10
반응형