[현장에서 바로 써먹는...] 정규분포와 중심극한정리
> ## Chapter4-2. 부화한 병아리들의 체중은 얼마일까? (정규분포와 중심극한정리)
>
> # ch4-2.csv 파일의 데이터 불러오기
> b <- read.csv("ch4-2.csv", header = TRUE)
> head(b)
chick_nm weight
1 b01 37
2 b02 39
3 b03 41
4 b04 45
5 b05 37
6 b06 33
> str(b)
'data.frame': 30 obs. of 2 variables:
$ chick_nm: chr "b01" "b02" "b03" "b04" ...
$ weight : int 37 39 41 45 37 33 34 31 40 41 ...
>
> # 대략적인 데이터의 분포 확인
> summary(b)
chick_nm weight
Length:30 Min. :31.00
Class :character 1st Qu.:36.25
Mode :character Median :39.00
Mean :38.40
3rd Qu.:40.75
Max. :45.00
>
> # B 부화장 병아리 무게 표준편차
> sd(b$weight)
[1] 3.286335
>
> # (참고)정규분포 그래프 설명용 그리기
> x <- seq(-5, 5, length = 500)
> y1 <- dnorm(x, mean = 0, sd = 1)
> y2 <- dnorm(x, mean = 0, sd = 2)
>
> plot(x, y1, type = "l", col = "blue", ylabel = NULL, xlabel = NULL, main = "표준편차(1, 2)에 따른 정규분포 비교")
> lines(x, y2, type = "l", col = "red")
> legend("topright", c("X~N(0,1)","X~N(0,4)"), text.col = c("blue", "red"))
>
> # Histogram으로 분포 확인
> hist(b$weight, col = "sky blue", xlab = "병아리 무게(g)", main = "B 부화장 병아리 무게 분포 현황")
>
> # Box-Plot으로 분포 확인
> boxplot(b$weight, col = "sky blue", main = "B 부화장 병아리 무게 상자그림")
>
> # 히스토그램과 Box-Plot을 같이 그리기
> par(mfrow=c(2,1)) # 행 2개, 열 1개
> hist(b$weight, col = "sky blue", xlab = "병아리 무게(g)", main = "B 부화장 병아리 무게 분포 현황")
> boxplot(b$weight, horizontal = TRUE, col = "sky blue")
출처 : 현장에서 바로 써먹는 데이터 분석 with R