R 12

R - wordcloud, grep, 정규표현식,stringr

더보기 ▣ 주요 키워드 ▣ wordcloud grep 정규표현식(Regular Expression) stringr ★wordcloud library(wordcloud) word 시작, 시작되는 문자를 찾는다. grep('^b',test,value=T) # b로 시작하는 값만 추출 $ -> 끝, 끝나는 문자를 찾는다. grep('b$',test,value=T) # b로 끝나는 값만 추출 \\b -> 시작되는 문자를 찾는데 빈문자열 뒤에 시작되는 문자도 찾는다. grep('\\bab',test,value=T) # ab로 시작하는 값만 추출하는데 빈문자열 뒤에 시작되는 s ab도 찾는다. . -> 어떤 문자 하나를 의미한다. grep('ab.',test,value=T) # ab뒤에 문자 하나 이상있는 값들 추..

R 2022.02.06

R - reshape2,cut,히스토그램,상자그림

더보기 ▣ 주요 키워드 ▣ reshape2(melt, dcast) cut 히스토그램 상자그림 ★ reshape2 melt : 칼럼이 많은 형태(wide) 가로를 세로 방향 긴(long) 형태로 변경하는 함수 install.packages('reshape2') library(reshape2) sales sales로 바꾸고 싶을 때 dcast함수 사용 m % # = reshape2::dcast(m,year~variable,sum) dplyr::group_by(year)%>% dplyr::summarise(qty=sum(qty),price=sum(price)) sales%>% # = reshape2::dcast(m,name~variable,sum) dplyr::group_by(name)%>% dplyr::su..

R 2022.01.26

R barplot, 산점도

더보기 ▣ 주요 키워드 ▣ barplot 산점도 ●색상 가져오기 library(RColorBrewer) #색상들을 가져올 수 있는 패키지 display.brewer.all() #모든 색상표 display.brewer.pal(10,'RdBu') #빨강파랑의 종류로 10가지 ●그래픽에 그래프를 몇 개 출력할지 정하는 옵션/ 그래픽에 나와있는 모든 이미지 제거 par(mfrow=c(1,1)) # 그래프를 하나만 출력 par(mfrow=c(2,3)) # 그래프를 2 x 3만큼 출력(6개) graphics.off() # 현재 나와있는 그래프 제거 [문제157] exam.csv file에는 학생들의 시험점수가 있습니다. 학생들의 SQL 점수를 막대그래프로 출력해주세요. exam

R 2022.01.25

R dplyr, sqldf함수

더보기 ▣ 주요 키워드 ▣ dplyr summarise(n()), count,add_count, inner_join, left_join, right_join, full_join, semi_join, anti_join sqldf ⊙부서별 급여를 기준으로 내림차순 순위를 구하세요.(연이은순위) 1.ddply df % dplyr::select(EMPLOYEE_ID,LAST_NAME,SALARY,DEPARTMENT_ID)%>% # EMPLOYEE_ID,LAST_NAME,SALARY,DEPARTMENT_ID만 추출 dplyr::group_by(DEPARTMENT_ID)%>% #department_id로 그룹핑 dplyr::mutate(순위=dplyr::dense_rank(desc(SALARY)), #dense_r..

R 2022.01.21

R dplyr, rank 함수

더보기 ▣ 주요 키워드 ▣ dplyr filter, select, arrange, %>%(파이프), mutate, summarise rank rank옵션, dense_rank, min_rank ⊙ 부서별 최고 급여자들의 정보 출력 1.ddply a % #조건2 SALARY가 10000이상인 것 arrange(desc(SALARY),LAST_NAME) #대상컬럼이 위에 있는 컬럼만 사용가능 없으면 오류 , 조건3 SALARY를 내림차순, LAST_NAME을 오름차순으로 정렬 ▶ dplyr::mutate : 새로운 컬럼을 추가하는 함수, 미리 보기 # 컬럼추가 employees$ann_sal = 5000) employees%>% filter(DEPARTMENT_ID ==30 & SALARY >= 5000)%..

R 2022.01.20