본문 바로가기
데이터분석/R

[ADP] PAM 군집 (Partitioning Around K-medoids Clustering)

by 버섯도리 2022. 1. 16.

> # 11. PAM 군집 (Partitioning Around K-medoids Clustering)


> library(cluster)
> set.seed(1234)
> fit.pam <- pam(wine[-1], k=3, stand = TRUE)
> fit.pam$medoids
     Alcohol Malic  Ash Alcalinity Magnesium Phenols Flavanoids Nonflavanoids Proanthocyanins Color  Hue Dilution Proline
[1,]   13.48  1.81 2.41       20.5       100    2.70       2.98          0.26            1.86   5.1 1.04     3.47     920
[2,]   12.25  1.73 2.12       19.0        80    1.65       2.03          0.37            1.63   3.4 1.00     3.17     510
[3,]   13.40  3.91 2.48       23.0       102    1.80       0.75          0.43            1.41   7.3 0.70     1.56     750
> # 변수별 관찰치를 보여준다.

clusplot(fit.pam, main = "Bivariate Cluster Plot")

> # Bivariate plot은 각 관측치들을 두 개의 주성분을 좌표로 하여 산점도로 나타낸 것이다. 각 군집은 각 군집에 속한 모든 관측치를 포함하는 가장 작은 타원으로 표시되어 있다.

> ct.pam = table(wine$Type, fit.pam$clustering)
randIndex(ct.pam)
      ARI 
0.6994957 
> # 이 데이터셋에서는 k-means에 비해 수행 능력이 떨어지는 것으로 나타났다.

 

 

 

 

 

출처 : 2020 데이터 분석 전문가 ADP 필기 한 권으로 끝내기