[ADP] 퍼지 군집 (Fuzzy Clustering)
> # 14. 퍼지 군집 (Fuzzy Clustering)
>
>
> # K-평균군집 또는 PAM 군집 등에서 자료의 각 원소들은 정확히 한 개의 군집으로만 할당된다.
> # 이러한 형태의 군집분석을 하드군집 또는 비퍼지군집이라 한다.
> # 반면에 퍼지군집은 소프트군집이라 하고 각 원소는 각 군집에 속할 확률을 갖게 된다.
>
> # USArrests dataset 퍼지군집 수행
> data("USArrests")
> set.seed(200)
> ss <- sample(1:50, 20)
> df <- scale(USArrests[ss,])
>
> library(cluster)
> f.clust <- fanny(df,4)
> f.clust
Fuzzy Clustering object of class 'fanny' :
m.ship.expon. 2
objective 6.0742
tolerance 1e-15
iterations 216
converged 1
maxit 500
n 20
Membership coefficients (in %, rounded):
[,1] [,2] [,3] [,4]
Pennsylvania 39 37 12 12
Washington 24 44 14 18
South Carolina 12 14 53 21
Minnesota 59 23 9 9
Nevada 15 20 24 41
Utah 28 42 14 17
Montana 43 27 17 14
Louisiana 11 16 43 30
Nebraska 60 23 9 8
Tennessee 13 18 42 27
Mississippi 15 17 48 21
Maryland 10 14 28 49
South Dakota 40 26 19 16
Delaware 22 34 21 23
Oklahoma 25 49 13 13
New Mexico 9 13 22 56
Colorado 16 23 21 40
New Jersey 23 36 18 23
Wisconsin 53 24 12 11
Virginia 24 38 20 18
Fuzzyness coefficients:
dunn_coeff normalized
0.32267480 0.09689973
Closest hard clustering:
Pennsylvania Washington South Carolina Minnesota Nevada Utah Montana Louisiana
1 2 3 1 4 2 1 3
Nebraska Tennessee Mississippi Maryland South Dakota Delaware Oklahoma New Mexico
1 3 3 4 1 2 2 4
Colorado New Jersey Wisconsin Virginia
4 2 1 2
Available components:
[1] "membership" "coeff" "memb.exp" "clustering" "k.crisp" "objective" "convergence" "diss"
[9] "call" "silinfo" "data"
>
> library(factoextra)
>
> fviz_cluster(f.clust, ellipse.type = 'norm', ellipse.level = 0.68)
>
출처 : 2020 데이터 분석 전문가 ADP 필기 한 권으로 끝내기