반응형

Python 27

[Pandas] DataFrame이란?

DataFrame 표 형식의 데이터 2차원 형태의 데이터를 다루기 위한 자료형(대부분의 자료는 2차원 형태임) 행(Row/Index) : 레코드 , 열(Column) : 데이터 특징 Numpy와의 차이점 Pandas는 Numpy를 기반으로 만들어짐 Numpy + 행/열에 이름 붙이기 기능(문자열, 숫자 다가능 : 다양한 자료형) Pandas vs Numpy import pandas as pd import numpy as np two_dimensional_list = [['dongwook', 50, 85], ['sineui', 89, 31], ['iljoong', 68, 91], ['yoonseo', 88, 75]] print(np.array([two_dimensional_list])) df = pd.Da..

Python/Pandas 2023.12.26

[Pandas] Pandas vs R

R은 기존에 DataScience 분야에서 많이 써온 툴이었음. R은 데이터 분석의 도구가 잘 갖춰져 있었음 (데이터 보관/정리/분석) 이를 파이썬이 Pandas 라이브러리로 복제함 기존 파이썬은 다양한 분야에서 써오던 툴로써, 데이터를 다루는 것 까지 용이 → 인기 많아짐 Pandas 기능 외부데이터를 읽고 쓰기 정리된 데이터를 새로운 파일에 저장 데이터 시각화 표 형식의 데이터를 다루기 용이

Python/Pandas 2023.12.25

[Numpy] Python List vs Numpy Array

덧셈의 경우 Numpy : 덧셈 수행 List : 이어 붙이기 성능 Numpy 간단한 문법, 뛰어난 성능 수치 계산이 많고 복잡할 떄 행렬 같은 다차원 배열의 경우 사용 List 값을 추가하고 제거하는 일 성능 차이 발생 이유 : 값이 저장되는 방식의 차이 Numpy : 같은 자료형만 저장 가능 List : 여러 자료형 저장 가능 numpy 통계 함수 최대 최소 import numpy as np array1 = np.array([14, 6, 13, 21, 23, 31, 9, 5]) print(array1.max()) # 최댓값 print(array1.min()) # 최솟값 # 31 # 5 평균 import numpy as np array1 = np.array([14, 6, 13, 21, 23, 31, 9..

Python/Numpy 2023.12.25
반응형