본문 바로가기

데이터분석/R76

[ADP] 연관성 분석 (Association Analysis) > # 17. 연관성 분석 (Association Analysis) > > > library(arules) > > data("Groceries") > dim(Groceries) [1] 9835 169 > str(Groceries) Formal class 'transactions' [package "arules"] with 3 slots ..@ data :Formal class 'ngCMatrix' [package "Matrix"] with 5 slots .. .. ..@ i : int [1:43367] 13 60 69 78 14 29 98 24 15 29 ... .. .. ..@ p : int [1:9836] 0 4 7 8 12 16 21 22 27 28 ... .. .. ..@ Dim : int [1:.. 2022. 1. 16.
[ADP] 서포트 벡터 머신 (Support Vector Machine) > # 16. 서포트 벡터 머신 (Support Vector Machine) > > > # 서포트 벡터 머신 모형은 고차원 또는 무한 차원의 공간에서 초평면의 집합을 찾아 분류와 회귀를 수행한다. > # 서포트 벡터 머신은 2개의 파라미터를 고려해야 한다. cost, gamma이다. > # cost는 초평면과 마진의 간격을 얼마나 할지 결정한다. cost가 크면 마진을 좁게 형성, 초평면이 복잡하게 나타난다. > # gamma는 영향을 미치는 범위의 의미이다. > > # iris dataset을 이용한 SVM > library(e1071) > > svm summary(svm) Call: svm(formula = Species ~ ., data = iris, type = "C-classification",.. 2022. 1. 16.
[ADP] K-NN (K-Nearest Neighbors) > # 15. K-NN (K-Nearest Neighbors) > > > # KNN은 데이터의 지역 구조(Local Structure)에 민감하다. > > # iris dataset의 KNN > library(DMwR) > > df trainiris testiris > nc3 table(testiris[,'Species'], nc3) nc3 setosa versicolor virginica setosa 18 0 0 versicolor 0 13 0 virginica 0 1 13 > > nc5 table(testiris[,'Species'], nc5) nc5 setosa versicolor virginica setosa 18 0 0 versicolor 0 13 0 virginica 0 1 13 출처 : 20.. 2022. 1. 16.
[ADP] 퍼지 군집 (Fuzzy Clustering) > # 14. 퍼지 군집 (Fuzzy Clustering) > > > # K-평균군집 또는 PAM 군집 등에서 자료의 각 원소들은 정확히 한 개의 군집으로만 할당된다. > # 이러한 형태의 군집분석을 하드군집 또는 비퍼지군집이라 한다. > # 반면에 퍼지군집은 소프트군집이라 하고 각 원소는 각 군집에 속할 확률을 갖게 된다. > > # USArrests dataset 퍼지군집 수행 > data("USArrests") > set.seed(200) > ss df > library(cluster) > f.clust f.clust Fuzzy Clustering object of class 'fanny' : m.ship.expon. 2 objective 6.0742 tolerance 1e-15 iterations.. 2022. 1. 16.
[ADP] 밀도기반 군집 (Density-based Clustering) > # 13. 밀도기반 군집 (Density-based Clustering) > > > # iris dataset에 대해 DBSCAN() 함수를 이용한 밀도기반군집을 실행한다. > library(fpc) > > head(iris) Sepal.Length Sepal.Width Petal.Length Petal.Width Species 1 5.1 3.5 1.4 0.2 setosa 2 4.9 3.0 1.4 0.2 setosa 3 4.7 3.2 1.3 0.2 setosa 4 4.6 3.1 1.5 0.2 setosa 5 5.0 3.6 1.4 0.2 setosa 6 5.4 3.9 1.7 0.4 setosa > iris1 head(iris1) Sepal.Length Sepal.Width Petal.Length Pet.. 2022. 1. 16.
[ADP] 혼합분포 군집 (Mixture Distribution Clustering) > # 12. 혼합분포 군집 (Mixture Distribution Clustering) > > > # iris dataset에 대해 Mclust() 함수를 통해 군집분석을 수행하면 혼합분포의 모수추정치와 함께 각 군집별 해당 자료에 대한 요약을 확인할 수 있다. > library(mclust) > > mc summary(mc, parameters=TRUE) ---------------------------------------------------- Gaussian finite mixture model fitted by EM algorithm ---------------------------------------------------- Mclust VEV (ellipsoidal, equal shape).. 2022. 1. 16.