[현장에서 바로 써먹는...] 상관분석
> ### Chapter 5. 상관분석과 회귀분석
>
> ## Chapter5-1. 병아리의 성장(체중)에 영향을 미치는 인자는 무엇일까? (상관분석)
>
> # 데이터 불러오기
> w <- read.csv("ch5-1.csv", header = TRUE)
> head(w)
chick_nm weight egg_weight movement food
1 a01 140 65 146 14
2 a02 128 62 153 12
3 a03 140 65 118 13
4 a04 135 65 157 13
5 a05 145 69 157 13
6 a06 138 65 143 13
> str(w)
'data.frame': 30 obs. of 5 variables:
$ chick_nm : chr "a01" "a02" "a03" "a04" ...
$ weight : int 140 128 140 135 145 138 125 148 133 145 ...
$ egg_weight: int 65 62 65 65 69 65 61 69 64 69 ...
$ movement : int 146 153 118 157 157 143 110 159 133 174 ...
$ food : int 14 12 13 13 13 13 11 15 11 13 ...
>
> # w 데이터 셋에서 2~5열 데이터만 가져오기(첫열은 chr이므로)
> w_n <- w[,2:5]
> head(w_n)
weight egg_weight movement food
1 140 65 146 14
2 128 62 153 12
3 140 65 118 13
4 135 65 157 13
5 145 69 157 13
6 138 65 143 13
>
> w_cor <- cor(w_n) # w_n 데이터 셋으로 상관분석한 결과를 w_cor변수에 넣음
> w_cor # w_cor 상관분석 결과 확인
weight egg_weight movement food
weight 1.0000000 0.9571693 0.3807186 0.8775735
egg_weight 0.9571693 1.0000000 0.4282457 0.8081467
movement 0.3807186 0.4282457 1.0000000 0.3190107
food 0.8775735 0.8081467 0.3190107 1.0000000
>
> plot(w_n) # w_n 데이터 셋 산점도로 표현
>
> library(corrplot) # corrplot 패키지 불러오기
corrplot 0.84 loaded
경고메시지(들):
패키지 ‘corrplot’는 R 버전 4.0.3에서 작성되었습니다
>
> # 그냥 한번 실행해보기(주의할 점은 데이터셋이 아닌 상관분석결과를 넣어야함)
> corrplot(w_cor) # 상관분석 결과인 w_cor을 corrplot 패키지로 실행해보기
>
> # 원을 타원으로 표시하고, 하단에만 표시하고, 상관계수 표시
> corrplot(w_cor, method = "ellipse",
+ type = "lower", addCoef.col = "white")
출처 : 현장에서 바로 써먹는 데이터 분석 with R