데이터분석/R

[현장에서 바로 써먹는...] 상관분석

버섯도리 2022. 4. 5. 06:21

> ### Chapter 5. 상관분석과 회귀분석

> ## Chapter5-1. 병아리의 성장(체중)에 영향을 미치는 인자는 무엇일까? (상관분석)

> # 데이터 불러오기
> w <- read.csv("ch5-1.csv", header = TRUE)
> head(w)
  chick_nm weight egg_weight movement food
1      a01    140         65      146   14
2      a02    128         62      153   12
3      a03    140         65      118   13
4      a04    135         65      157   13
5      a05    145         69      157   13
6      a06    138         65      143   13
> str(w)
'data.frame': 30 obs. of  5 variables:
 $ chick_nm  : chr  "a01" "a02" "a03" "a04" ...
 $ weight    : int  140 128 140 135 145 138 125 148 133 145 ...
 $ egg_weight: int  65 62 65 65 69 65 61 69 64 69 ...
 $ movement  : int  146 153 118 157 157 143 110 159 133 174 ...
 $ food      : int  14 12 13 13 13 13 11 15 11 13 ...

> # w 데이터 셋에서 2~5열 데이터만 가져오기(첫열은 chr이므로)
> w_n <- w[,2:5]
> head(w_n)
  weight egg_weight movement food
1    140         65      146   14
2    128         62      153   12
3    140         65      118   13
4    135         65      157   13
5    145         69      157   13
6    138         65      143   13

> w_cor <- cor(w_n)  # w_n 데이터 셋으로 상관분석한 결과를 w_cor변수에 넣음
> w_cor  # w_cor 상관분석 결과 확인
              weight egg_weight  movement      food
weight     1.0000000  0.9571693 0.3807186 0.8775735
egg_weight 0.9571693  1.0000000 0.4282457 0.8081467
movement   0.3807186  0.4282457 1.0000000 0.3190107
food       0.8775735  0.8081467 0.3190107 1.0000000

plot(w_n)  # w_n 데이터 셋 산점도로 표현


> library(corrplot)  # corrplot 패키지 불러오기
corrplot 0.84 loaded
경고메시지(들): 
패키지 ‘corrplot’는 R 버전 4.0.3에서 작성되었습니다 

> # 그냥 한번 실행해보기(주의할 점은 데이터셋이 아닌 상관분석결과를 넣어야함)
corrplot(w_cor)  # 상관분석 결과인 w_cor을 corrplot 패키지로 실행해보기


> # 원을 타원으로 표시하고, 하단에만 표시하고, 상관계수 표시
corrplot(w_cor, method = "ellipse"
+          type = "lower", addCoef.col = "white")



 

 

 

 

 

출처 : 현장에서 바로 써먹는 데이터 분석 with R