본문 바로가기
데이터분석/R

[실무 프로젝트로 배우는...] 통계적 가설 검정

by 버섯도리 2022. 1. 25.

> ### 3.5 중고차 가격 분석을 위한 통계적 가설 검정

> #### 3.5.1 귀무가설과 대립가설    

> # 데이터 샘플   
> set.seed(1234)
> SL = sample(1:nrow(Audi), nrow(Audi) * 0.7, replace = FALSE)
> Sample = Audi[SL,]

> # 평균, 표준편차, 분위수 계산
> Mean = mean(log(Sample$price))
> Sd = sd(log(Sample$price))
> n = nrow(Sample)
> t0025 = qt(p = 0.025, df = n-1)
> t0975 = qt(p = 0.975, df = n-1)

> # 신뢰구간 계산

Lower = Mean + t0025 * Sd/sqrt(n)
> Lower
[1] 9.915643

Upper = Mean + t0975* Sd/sqrt(n)
> Upper
[1] 9.937139

> mean(log(Audi$price))
[1] 9.928069


> #### 3.5.2 검정통계량과 임곗값

> # 검정통계량과 임곗값    

> mu = 9.94
Tvalue = (Mean - mu)/(Sd/sqrt(n)) 
> Tvalue
[1] -2.482155

Critical_Value = qt(p = 0.025, df = n-1)
> Critical_Value
[1] -1.960282

> # 검정통계량이 임계값보다 더 작음 (중심으로부터 더 멀리 위치함)

> # 유의확률과 유의수준   

Pvalue = pt(q = Tvalue, df = n-1) * 2
> Pvalue
[1] 0.01308087

Significant_Value = pt(q = Critical_Value, df = n-1) * 2
> Significant_Value
[1] 0.05

> # 모평균이 9.94일 때 표본평균 9.92보다 더 극단적인 값이 나올 확률이 1.3% 밖에 안된다는 의미.
> # 유의수준 0.5보다 PValue가 작으므로 귀무가설을 기각

 

 

 

 

 

출처 : 실무 프로젝트로 배우는 데이터 분석 with R