본문 바로가기
데이터분석/R

[현장에서 바로 써먹는...] 기초통계량

by 버섯도리 2022. 4. 2.

> ### Chapter 4. 통계분석과 기본 그래프

> ## Chapter4-1. 어제까지 몇 마리의 병아리가 부화했을까? (기초통계량)

> # ch4-1.csv 파일의 데이터 불러오기
> hat <- read.csv("ch4-1.csv", header = TRUE)
> hat
  hatchery chick
1        A    30
2        B    30
3        C    29
4        D    26
5        E    24
6        F    28
7        G    27

> # 데이터 정렬하기
> hat_asc <- hat[order(hat$chick),] # chick 열을 기준으로 오름차순 정렬
> hat_asc
  hatchery chick
5        E    24
4        D    26
7        G    27
6        F    28
3        C    29
1        A    30
2        B    30

> # 간단한 그래프를 그려서 보자
> # 막대그래프
barplot(hat$chick)


> # 다양한 옵션을 통해 막대그래프 정보를 추가하자
barplot(hat$chick, names.arg = hat$hatchery,
+         col = c("red","orange","yellow","green", "blue", "navy", "violet"), 
+         main = "부화장별 병아리 부화현황", xlab = "부화장", ylab = "병아리수",
+         ylim = c(0,35))


> ?barplot

> library(RColorBrewer) # RColorBrewer 패키지 현재 작업 환경으로 불러오기
경고메시지(들): 
패키지 ‘RColorBrewer’는 R 버전 4.0.3에서 작성되었습니다 

> display.brewer.all()


> col7 <- brewer.pal(7, "Pastel2")  # col7이라는 변수에 "Pastel2"라는 팔레트에서 7개의 색상을 집어넣음

barplot(hat$chick, names.arg = hat$hatchery,
+         col = col7
+         main = "부화장별 병아리 부화현황", xlab = "부화장", ylab = "병아리수",
+         ylim = c(0,35))



> bar_x <- barplot(hat$chick)  # bar_x 변수에 barplot의 x좌표 집어넣음

> # 위에 bar_chart라는 변수를 만들어주는 이유는 x좌표를 알아내기 위함임
> bar_x
     [,1]
[1,]  0.7
[2,]  1.9
[3,]  3.1
[4,]  4.3
[5,]  5.5
[6,]  6.7
[7,]  7.9

> # 다시 예쁜 그래프 그리기
barplot(hat$chick, names.arg = hat$hatchery,
+         col = col7, 
+         main = "부화장별 병아리 부화현황", xlab = "부화장", ylab = "병아리수",
+         ylim = c(0,35))

> # 막대그래프에 text 추가, 라벨에 2가지 이상 넣을때는 paste를 써야함, pos는 라벨의 위치
text(x = bar_x, y = hat$chick, labels = hat$chick, pos = 3)

> # 막대그래프에 30기준으로 빨간색 점선 추가
abline(h = 30, col = "red", lty = 2, lwd = 1)


> # 파이차트 그리기

> # 파이차트 그리기에 앞서 Percentage 열 만들어줌
> hat$pct <- round(hat$chick/sum(hat$chick)*100, 1)
> hat
  hatchery chick  pct
1        A    30 15.5
2        B    30 15.5
3        C    29 14.9
4        D    26 13.4
5        E    24 12.4
6        F    28 14.4
7        G    27 13.9

> # 파이차트 그리기
> ?pie
pie(hat$chick, labels = paste(hat$hatchery, hat$pct, "%")
+     col = col7, clockwise = TRUE, 
+     main = "부화장별 병아리 부화 비율")

 

 

 

 

 

 

출처 : 현장에서 바로 써먹는 데이터 분석 with R