반응형
Elbow Method
: 최적의 클러스터 갯수 찾는 방법
- 클러스터마다 속한 데이터와 Centroid 사이 거리의 합이 작아야 함.
inertia
: 각 클러스터에 속한 데이터들과 Centroid 사이의 거리를 제곱해서 전부 더한 값
Elbow Method 지점 찾기
import pandas as pd
from sklearn.cluster import KMeans
import seaborn as sns
%matplotlib inline
scaled_df = pd.read_csv('data/scaled_data.csv', index_col=[0])
inertias = []
for k in range(1, 16):
model = KMeans(n_clusters=k, n_init=10, random_state=123) # 모델 설정
model.fit(scaled_df) # 모델 학습
inertias.append(model.inertia_) # inertia값 데이터에 더하기
# 시각화
sns.set(style="darkgrid")
sns.lineplot(x=range(1,16), y=inertias, marker='o')

반응형
'Python > Pandas' 카테고리의 다른 글
[DataAnalysis] Kmeans 결과 해석 (1) | 2024.02.01 |
---|---|
[DataAnalysis] Clustering (0) | 2024.01.31 |
[Pandas] 파이 차트 (0) | 2024.01.23 |
[Pandas] Data Merge (0) | 2024.01.22 |
[Pandas] groupby 카테고라이징 (0) | 2024.01.22 |