본문 바로가기

데이터분석/R76

[R 통계분석] 확률과 확률분포 Section 01. 확률 > ## 01) prob 패키지를 이용한 확률 계산 > > library(prob) > # 동전던지기 실험의 표본공간을 생성 > tosscoin(1) toss1 1 H 2 T > # 주사위 굴리기 실험의 표본공간을 생성 > rolldie(1) X1 1 1 2 2 3 3 4 4 5 5 6 6 > # 사용자가 입력한 벡터 값의 개별 원소들로 구성된 표본공간을 생성, size = 실험횟수 > urnsamples(1:3, size = 2) X1 X2 1 1 2 2 1 3 3 2 3 > # replace = T일 경우 복원추출, 기본값은 비복원추출(F)이다. > urnsamples(1:3, size = 2, replace = T) X1 X2 1 1 1 2 1 2 3 1 3 4 2 2 5.. 2022. 8. 10.
[R 통계분석] 기술통계학 > ## 00) data 준비 > > # 통계청 마이크로데이터 통합서비스(https://mdis.kostat.go.kr/) - 인구 > 인구주택총조사 > 1%_인구사항(제공) > 2010 > data str(data) 'data.frame': 468284 obs. of 6 variables: $ 성별코드 : int 1 1 1 1 1 1 1 1 1 1 ... $ 만연령 : int 0 0 0 0 0 0 0 0 0 0 ... $ 가구주관계코드 : int 3 3 3 3 3 3 3 3 3 3 ... $ 교육정도코드 : int 1 1 1 1 1 1 1 1 1 1 ... $ 총출생아수_남아수: int NA NA NA NA NA NA NA NA NA NA ... $ 총출생아수_여아수: int NA NA NA NA NA.. 2022. 8. 9.
[R 데이터분석 with 샤이니] 교통 카드 데이터 분석 사례 04 - 종합 분석 > ## 8 종합 분석 > > > # Step 1 : 버스노선 네트워크 만들기 > > ## 화성시 대중교통 이동 네트워크 > # 데이터 불러오기 > setwd(dirname(rstudioapi::getSourceEditorContext()$path)) > load("./01_save/04_002_trip_chain.rdata") > load("./01_save/04_003_grid_chain.rdata") > load("./01_save/04_001_sta_pnt.rdata") > load("./01_save/01_002_fishnet.rdata") > load("./01_save/01_001_admin.rdata") > ## 집계구 간 이동만 남기기(집계구 내 이동 지우기) > library(stpla.. 2022. 8. 6.
[R 데이터분석 with 샤이니] 교통 카드 데이터 분석 사례 03 - 교통 흐름 분석 > ## 6 교통 흐름 분석 1 : 통근 시간대 > > > # Step 1 : 통근 시간대 교통 흐름 분석 > > ## 통근 시간대 데이터 필터링 > # 데이터 불러오기 > setwd(dirname(rstudioapi::getSourceEditorContext()$path)) > load("./01_save/04_002_trip_chain.rdata") > load("./01_save/04_001_sta_pnt.rdata") > load("./01_save/01_002_fishnet.rdata") > load("./01_save/01_001_admin.rdata") > # 통근 통행 필터링 (오전 7,8,9시 + 오후 17,18,19시) > library(dplyr) > trip_cmt rownames(.. 2022. 8. 4.
[R 데이터분석 with 샤이니] 교통 카드 데이터 분석 사례 02 - 기초 분석 > ## 4 기초 분석 1 : 노선별, 시간대별 이용량 > > > # Step 1 : 노선별, 시간대별 이용량 특성 분석 > > ## 이용자가 몇 번 버스를 타고 어디에서 어디로 이동하였는지 알아내기 > # 개별 이동 데이터 불러오기 > load("./01_save/02_003_trip_chain.rdata") > # 버스노선 정보 불러오기 > route_map head(route_map) 구분 운수사명 운수사ID 이비노선ID 표준노선ID 노선명 1 경기시내 경원여객M 2805000 216000044 28050900 M6410 2 경기시내 강화운수 4100100 232000028 41001001 2 3 경기시내 강화운수 4100100 232000029 41001013 88 4 경기시내 강화운수 41001.. 2022. 7. 30.
[R 데이터분석 with 샤이니] 교통 카드 데이터 분석 사례 01 - 데이터 전처리 > ## 2 데이터 전처리 1 : 지역 정보 > > # Step 1 : 집계구 만들기 > > library(sp) > install.packages("geojsonio") > library(geojsonio) > setwd(dirname(rstudioapi::getSourceEditorContext()$path)) > dir.create("./01_save") > # 행정동 geojson 불러오기 > admin save(admin, file = "./01_save/01_001_admin.rdata") > # 플로팅 > plot(admin) > > ## 집계구 외곽 경계 만들기 > library(raster) > library(leaflet) > # 외곽 경계 만들기 : x_min, x_max, y_min.. 2022. 7. 30.