데이터분석/R76 [실무 프로젝트로 배우는...] 데이터 구조 변환 > ### 2.15 데이터 구조 변환 > > Audi_S = Audi %>% + group_by(model, year) %>% + summarise(Count = n()) `summarise()` has grouped output by 'model'. You can override using the `.groups` argument. > > Audi_S # A tibble: 221 x 3 # Groups: model [26] model year Count 1 " A1" 2010 1 2 " A1" 2011 5 3 " A1" 2012 21 4 " A1" 2013 58 ... 10 " A1" 2019 213 # ... with 211 more rows > > > #### 2.15.1 reshape 패키지 활용.. 2022. 1. 21. [실무 프로젝트로 배우는...] 데이터 시각화 기초 (ggplot2 패키지) > ### 2.14 중고차 데이터를 활용한 데이터 시각화 기초 (ggplot2 패키지) > > #### 2.14.1 ggplot2 기본 문법 > > library(ggplot2) > DIR = "F:/1_Study/1_BigData/12_R/02_Practical-R/Data/" > Audi = read.csv(paste0(DIR, "audi.csv"),stringsAsFactors = FALSE) > > # 그래프 그리기 > > ggplot(Audi,aes(x = year)) + + geom_bar() > > # 그래프 배경 수정 > ggplot(Audi,aes(x = year)) + + geom_bar() + + theme_classic() > > # 그래프 축의 글꼴 수정 > ggplot(Audi,.. 2022. 1. 21. [실무 프로젝트로 배우는...] dplyr 응용 > ### 2.13 dplyr 응용 > > #### 2.13.1 데이터 전처리 응용 1 > > P1 = Audi %>% + mutate(year_G = ifelse(year % + summarise(Count = n(), + Mean_Price = mean(price), + Median_Price = median(price)) %>% + mutate(Perc = Count / sum(Count)) %>% + arrange(year_G,-Mean_Price) `summarise()` has grouped output by 'year_G'. You can override using the `.groups` argument. > > > #### 2.13.1 데이터 전처리 응용 2 > > P2 = Audi %>.. 2022. 1. 21. [실무 프로젝트로 배우는...] 데이터 전처리 2 - dplyr 패키지 > ### 2.12 중고차 데이터를 활용한 데이터 전처리 2 - dplyr 패키지 > > > #### 2.12.1 체인 연산자 > > library(dplyr) > colMeans(filter(.data = Audi, year > 2016)[,c("tax","mpg","engineSize")]) tax mpg engineSize 139.188766 47.049449 1.922512 > > Audi %>% + filter(year > 2016) %>% + select(tax,mpg,engineSize) %>% + colMeans() tax mpg engineSize 139.188766 47.049449 1.922512 > > > #### 2.12.2 데이터셋에 새로운 변수 추가 > > Audi2 = Aud.. 2022. 1. 20. [실무 프로젝트로 배우는...] 데이터 전처리 1 - apply > Normalization = function(x){ + y = (x-min(x))/(max(x)-min(x)) + return(y) + } > > ### 2.11 중고차 데이터를 활용한 데이터 전처리 1 - apply > > # 데이터 불러오기 > # Download URL : https://www.kaggle.com/adityadesai13/used-car-dataset-ford-and-mercedes > DIR = "F:/1_Study/1_BigData/12_R/02_Practical-R/Data/" > Audi = read.csv(paste0(DIR, "audi.csv"),stringsAsFactors = FALSE) > str(Audi) 'data.frame': 10668 obs. of 9 v.. 2022. 1. 19. [ADP] 순차 패턴 분석 (Sequence Pattern Analysis) > # 18. 순차 패턴 분석 (Sequence Pattern Analysis) > > > # 순차적 패턴의 발견은 구매 순서가 고려되어 상품 간의 연관성이 측정되고, 유용한 연관규칙을 찾는 기법이다. > # 그러므로 이러한 규칙 발견을 위해서는 데이터에 각각의 고객으로부터 발생한 구매 시점에 대한 정보가 있어야 한다. > > # 깃허브의 데이터셋을 활용한다. http://github.com/datameister66/data/blob/master/sequential.csv 다운로드 후에 C:\data 폴더에 저장한다. > # Cust_segment - 소비자를 포함한 factor 변수군 > # Purchase1부터 Purchase8로 이름 붙인 8개의 개별적인 구매 사건을 의미 > # 순차 패턴 분석을 .. 2022. 1. 16. 이전 1 ··· 7 8 9 10 11 12 13 다음