Python/Pandas

[DataAnalysis] Elbow Method

공기반 코딩반 2024. 2. 1. 01:54
반응형

Elbow Method

: 최적의 클러스터 갯수 찾는 방법

- 클러스터마다 속한 데이터와 Centroid 사이 거리의 합이 작아야 함.



inertia

: 각 클러스터에 속한 데이터들과 Centroid 사이의 거리를 제곱해서 전부 더한 값

 

 

 

Elbow Method 지점 찾기

import pandas as pd
from sklearn.cluster import KMeans
import seaborn as sns
%matplotlib inline

scaled_df = pd.read_csv('data/scaled_data.csv', index_col=[0])
inertias = []



for k in range(1, 16):
    model = KMeans(n_clusters=k, n_init=10, random_state=123)   # 모델 설정
    model.fit(scaled_df)   # 모델 학습
    inertias.append(model.inertia_)   # inertia값 데이터에 더하기


# 시각화
sns.set(style="darkgrid")
sns.lineplot(x=range(1,16), y=inertias, marker='o')

 

 

반응형

'Python > Pandas' 카테고리의 다른 글

[DataAnalysis] Kmeans 결과 해석  (1) 2024.02.01
[DataAnalysis] Clustering  (0) 2024.01.31
[Pandas] 파이 차트  (0) 2024.01.23
[Pandas] Data Merge  (0) 2024.01.22
[Pandas] groupby 카테고라이징  (0) 2024.01.22