데이터분석/R

[ADP] 퍼지 군집 (Fuzzy Clustering)

버섯도리 2022. 1. 16. 12:03

> # 14. 퍼지 군집 (Fuzzy Clustering)


> # K-평균군집 또는 PAM 군집 등에서 자료의 각 원소들은 정확히 한 개의 군집으로만 할당된다.
> # 이러한 형태의 군집분석을 하드군집 또는 비퍼지군집이라 한다.
> # 반면에 퍼지군집은 소프트군집이라 하고 각 원소는 각 군집에 속할 확률을 갖게 된다.

> # USArrests dataset 퍼지군집 수행
> data("USArrests")
> set.seed(200)
> ss <- sample(1:50, 20)
> df <- scale(USArrests[ss,])

> library(cluster)
> f.clust <- fanny(df,4)
> f.clust
Fuzzy Clustering object of class 'fanny' :                      
m.ship.expon.        2
objective       6.0742
tolerance        1e-15
iterations         216
converged            1
maxit              500
n                   20
Membership coefficients (in %, rounded):
               [,1] [,2] [,3] [,4]
Pennsylvania     39   37   12   12
Washington       24   44   14   18
South Carolina   12   14   53   21
Minnesota        59   23    9    9
Nevada           15   20   24   41
Utah             28   42   14   17
Montana          43   27   17   14
Louisiana        11   16   43   30
Nebraska         60   23    9    8
Tennessee        13   18   42   27
Mississippi      15   17   48   21
Maryland         10   14   28   49
South Dakota     40   26   19   16
Delaware         22   34   21   23
Oklahoma         25   49   13   13
New Mexico        9   13   22   56
Colorado         16   23   21   40
New Jersey       23   36   18   23
Wisconsin        53   24   12   11
Virginia         24   38   20   18
Fuzzyness coefficients:
dunn_coeff normalized 
0.32267480 0.09689973 
Closest hard clustering:
  Pennsylvania     Washington South Carolina      Minnesota         Nevada           Utah        Montana      Louisiana 
             1              2              3              1              4              2              1              3 
      Nebraska      Tennessee    Mississippi       Maryland   South Dakota       Delaware       Oklahoma     New Mexico 
             1              3              3              4              1              2              2              4 
      Colorado     New Jersey      Wisconsin       Virginia 
             4              2              1              2 

Available components:
 [1] "membership"  "coeff"       "memb.exp"    "clustering"  "k.crisp"     "objective"   "convergence" "diss"       
 [9] "call"        "silinfo"     "data"       

> library(factoextra)

fviz_cluster(f.clust, ellipse.type = 'norm', ellipse.level = 0.68)

 

 

 

 

 

출처 : 2020 데이터 분석 전문가 ADP 필기 한 권으로 끝내기