데이터분석/R76 [현장에서 바로 써먹는...] 군집분석 > ## Chapter 6-3. 효과적인 사육을 위해 사육환경을 분리해보자 (군집 알고리즘) > > # K-means Clustering > > cl str(cl) # 데이터 셋 형태 확인 'data.frame': 100 obs. of 3 variables: $ breeds: chr "a" "a" "a" "a" ... $ weight: int 2765 2843 2678 2595 2734 2616 2605 2838 2900 2415 ... $ food : int 217 235 207 204 226 197 216 219 237 178 ... > cl$breeds summary(cl) breeds weight food a:100 Min. :2403 Min. :178 1st Qu.:2551 1st Qu.:197.. 2022. 4. 9. [현장에서 바로 써먹는...] 분류분석 > ## Chapter 6-2. 병아리 품종을 구분할 수 있을까? (분류 알고리즘) > > > # Naive Bayes > library(e1071) > > c_train c_test str(c_train) 'data.frame': 240 obs. of 4 variables: $ wing_length: int 238 236 256 240 246 233 235 241 232 234 ... $ tail_length: int 63 67 65 63 65 65 66 66 64 64 ... $ comb_height: int 34 30 34 35 30 30 30 35 31 30 ... $ breeds : chr "a" "a" "a" "a" ... > str(c_test) 'data.frame': 60 obs. of .. 2022. 4. 9. [현장에서 바로 써먹는...] 로지스틱 회귀 > ### Chapter 6. 분류 및 군집분석 > > ## Chapter 6-1. 병아리의 성별을 구분할 수 있을까? (로지스틱 회귀) > > # 데이터 불러오기 > g head(g) wing_length tail_length gender 1 44 9 m 2 42 9 m 3 43 8 m 4 40 10 m 5 44 8 m 6 43 8 m > str(g) 'data.frame': 60 obs. of 3 variables: $ wing_length: int 44 42 43 40 44 43 42 43 41 43 ... $ tail_length: int 9 9 8 10 8 8 8 8 10 8 ... $ gender : chr "m" "m" "m" "m" ... > > g$gender str(g) 'data.fr.. 2022. 4. 9. [현장에서 바로 써먹는...] 회귀분석 > ## Chapter5-2. 병아리의 무게를 예측할 수 있을까? (회귀분석) > > # 단순선형 회귀분석 실시 > w_lm # 회귀모델 결과 확인 > summary(w_lm) Call: lm(formula = weight ~ egg_weight, data = w_n) Residuals: Min 1Q Median 3Q Max -3.0177 -1.7148 0.1394 1.8080 2.9594 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) -14.5475 8.7055 -1.671 0.106 egg_weight 2.3371 0.1336 17.493 # 산점도에 회귀직선을 표시해 모델이 데이터를 잘 대표하는지 확인 > plot(w_n$egg_we.. 2022. 4. 7. [현장에서 바로 써먹는...] 상관분석 > ### Chapter 5. 상관분석과 회귀분석 > > ## Chapter5-1. 병아리의 성장(체중)에 영향을 미치는 인자는 무엇일까? (상관분석) > > # 데이터 불러오기 > w head(w) chick_nm weight egg_weight movement food 1 a01 140 65 146 14 2 a02 128 62 153 12 3 a03 140 65 118 13 4 a04 135 65 157 13 5 a05 145 69 157 13 6 a06 138 65 143 13 > str(w) 'data.frame': 30 obs. of 5 variables: $ chick_nm : chr "a01" "a02" "a03" "a04" ... $ weight : int 140 128 140 135 14.. 2022. 4. 5. [현장에서 바로 써먹는...] 가설검정 > ## Chapter4-3. 사료 제조사별 성능차이가 있을까? (가설검정) > > # ch4-3.csv 파일의 데이터 불러오기 > test test hatchery chick_nm weight 1 A a01 112 2 A a05 116 3 A a09 106 4 A a12 104 5 A a15 116 6 A a17 118 7 A a26 110 8 A a28 112 9 A a29 106 10 A a30 108 11 B b01 100 12 B b02 110 13 B b07 98 14 B b11 100 15 B b13 104 16 B b17 112 17 B b22 106 18 B b27 106 19 B b28 96 20 B b30 110 > > # 상자그림을 2개 그려서 비교해봄 > boxplot(weight.. 2022. 4. 2. 이전 1 ··· 3 4 5 6 7 8 9 ··· 13 다음