> # 11. PAM 군집 (Partitioning Around K-medoids Clustering)
>
>
> library(cluster)
> set.seed(1234)
> fit.pam <- pam(wine[-1], k=3, stand = TRUE)
> fit.pam$medoids
Alcohol Malic Ash Alcalinity Magnesium Phenols Flavanoids Nonflavanoids Proanthocyanins Color Hue Dilution Proline
[1,] 13.48 1.81 2.41 20.5 100 2.70 2.98 0.26 1.86 5.1 1.04 3.47 920
[2,] 12.25 1.73 2.12 19.0 80 1.65 2.03 0.37 1.63 3.4 1.00 3.17 510
[3,] 13.40 3.91 2.48 23.0 102 1.80 0.75 0.43 1.41 7.3 0.70 1.56 750
> # 변수별 관찰치를 보여준다.
>
> clusplot(fit.pam, main = "Bivariate Cluster Plot")

> # Bivariate plot은 각 관측치들을 두 개의 주성분을 좌표로 하여 산점도로 나타낸 것이다. 각 군집은 각 군집에 속한 모든 관측치를 포함하는 가장 작은 타원으로 표시되어 있다.
>
> ct.pam = table(wine$Type, fit.pam$clustering)
> randIndex(ct.pam)
ARI
0.6994957
> # 이 데이터셋에서는 k-means에 비해 수행 능력이 떨어지는 것으로 나타났다.
>
출처 : 2020 데이터 분석 전문가 ADP 필기 한 권으로 끝내기
'데이터분석 > R' 카테고리의 다른 글
[ADP] 밀도기반 군집 (Density-based Clustering) (0) | 2022.01.16 |
---|---|
[ADP] 혼합분포 군집 (Mixture Distribution Clustering) (0) | 2022.01.16 |
[ADP] K-평균 군집 (K-means Clustering) (0) | 2022.01.16 |
[ADP] 계층적 군집분석 (Hierachical Clustering Analysis) (0) | 2022.01.16 |
[ADP] 랜덤 포레스트 (Random Forest) (0) | 2022.01.15 |