> # 16. 서포트 벡터 머신 (Support Vector Machine)
>
>
> # 서포트 벡터 머신 모형은 고차원 또는 무한 차원의 공간에서 초평면의 집합을 찾아 분류와 회귀를 수행한다.
> # 서포트 벡터 머신은 2개의 파라미터를 고려해야 한다. cost, gamma이다.
> # cost는 초평면과 마진의 간격을 얼마나 할지 결정한다. cost가 크면 마진을 좁게 형성, 초평면이 복잡하게 나타난다.
> # gamma는 영향을 미치는 범위의 의미이다.
>
> # iris dataset을 이용한 SVM
> library(e1071)
>
> svm <- svm(Species~., data = iris, type = "C-classification", kernel = 'radial', cost = 10, gamma = 0.1)
> summary(svm)
Call:
svm(formula = Species ~ ., data = iris, type = "C-classification", kernel = "radial", cost = 10, gamma = 0.1)
Parameters:
SVM-Type: C-classification
SVM-Kernel: radial
cost: 10
Number of Support Vectors: 32
( 3 16 13 )
Number of Classes: 3
Levels:
setosa versicolor virginica
>
> pred <- predict(svm, iris, decision.values = TRUE)
> table(pred, iris$Species)
pred setosa versicolor virginica
setosa 50 0 0
versicolor 0 47 0
virginica 0 3 50
> # 정확도는 147/150=98%
>
출처 : 2020 데이터 분석 전문가 ADP 필기 한 권으로 끝내기
'데이터분석 > R' 카테고리의 다른 글
[ADP] 순차 패턴 분석 (Sequence Pattern Analysis) (0) | 2022.01.16 |
---|---|
[ADP] 연관성 분석 (Association Analysis) (0) | 2022.01.16 |
[ADP] K-NN (K-Nearest Neighbors) (0) | 2022.01.16 |
[ADP] 퍼지 군집 (Fuzzy Clustering) (0) | 2022.01.16 |
[ADP] 밀도기반 군집 (Density-based Clustering) (0) | 2022.01.16 |