머신러닝 14

파이썬 파일 읽고 쓰기(open, close, write, read, with, csv, pickle)

더보기 ▣ 중요 키워드 ▣ open, close, write, read, readline, readlines with 문 csv pickle ★ 파일 읽고 쓰기 함수 - open, close : 생성과 종료 - write : 파일 쓰기 - readline, readlines, read : 파일 읽어오기 ▶ 파일 쓰기 file = open('c:/data/test.txt','w') # 파일 생성( 'w'는 파일을 쓰기위한 옵션 ) for i in range(1,11): txt = '%d 오늘도 행복하자\n'%i file.write(txt) # 파일에 txt 입력 file.close() # 파일 닫기 ▶ 파일 읽기 # readline : 한 줄씩 읽기 file = open('c:/data/test.txt',..

PYTHON 2022.04.15

파이썬 합, 평균, 분산, 표준편차, Feature Scailing(표준화, 정규화)

더보기 ▣ 주요 키워드 ▣ 합, 평균, 분산, 표준편차 Feature Scailing 표준화 정규화 ★ 합, 평균, 분산, 표준편차 > 합 = 관측값의 합 > 평균 : 관측값의 합 / 관측값의 수 > 분산 : 편차제곱합 / 관측값의 수 ※ 편차제곱합 : 편차**2 + 편차**2 .... (편차제곱들의 합) ※ 편차 : 관측값 - 평균 > 표준편차 : 루트(분산) def sum(*arg): total = 0 for i in arg: total += i return total sum(1,2,3,4,5) def mean(*arg): return sum(*arg)/len(arg) mean(1,2,3,4,5) def variance(*arg): total = 0 for i in arg: total += (i - ..

PYTHON 2022.04.09

파이썬(스택,pop,enumerate,큐)

더보기 ▣ 주요 키워드 ▣ 스택(Stack) pop() enumerate() 큐(Queue) ★ 스택(stack) 스택(stack) - 데이터를 임시로 저장할 때 사용하는 자료형 - LIFO(Last In First Out) : 가장 나중에 입력한 데이터를 가장 먼저 꺼낸다(삭제) - push, pop # pop() : 마지막에 들어온 값, 맨 끝 값 제거(추출) stack이라는 변수에 값을 추가하는 push함수, 값을 제거하는 pop()함수, stack변수에 어떤 값이 있는지 확인하는 check함수 구현 stack = [] # stack 변수 체크 def check(): if len(stack) == 0: print('stack 변수에 값이 없습니다.') else: print('stack 변수에 값이 ..

PYTHON 2022.04.02

파이썬(operator.itemgetter,리스트 내장객체, 함수)

더보기 ▣ 주요 키워드 ▣ operator.itemgetter() 리스트 내장객체(list comprehension) 함수(function) ★ opertator.itemgetter() - sorted함수로 정렬할 때 사용되는 옵션 import collections word = ('사랑','우정','인생','사랑','인생','고민','열정','열정', '관심','인생','취업','취업','애정','애정','열정','사랑') word_cnt = collections.Counter(word) sorted(word_cnt) # key만 정렬 value값 출력x sorted(word_cnt.keys()) # key만 정렬 value값 출력x sorted(word_cnt.values()) # value만 정렬 k..

PYTHON 2022.04.02

파이썬(반복문,collections)

더보기 ▣ 주요 키워드 ▣ 반복문 while문 continue, break ※pop(), print(end='')옵션 for문 ※range() collections defaultdict Counter ※get, setdefault ★ 반복문 1. while문 1. while문 - 조건이 True인 동안에 반복을 수행한다. while 조건문: 반복수행할 문장 i = 0 while i values값 출력, 키값이 없으면 default값 출력 ※ dict.setdefault : 키값에 대해서 기본값을 설정해주는 함수 -빈도수 체크하기 여러가지 방법 word = ('사랑','우정','인생','사랑','인생','고민','열정','열정', '관심','인생','취업','취업','애정','애정','열정','사랑') 1..

PYTHON 2022.03.27

R barplot, 산점도

더보기 ▣ 주요 키워드 ▣ barplot 산점도 ●색상 가져오기 library(RColorBrewer) #색상들을 가져올 수 있는 패키지 display.brewer.all() #모든 색상표 display.brewer.pal(10,'RdBu') #빨강파랑의 종류로 10가지 ●그래픽에 그래프를 몇 개 출력할지 정하는 옵션/ 그래픽에 나와있는 모든 이미지 제거 par(mfrow=c(1,1)) # 그래프를 하나만 출력 par(mfrow=c(2,3)) # 그래프를 2 x 3만큼 출력(6개) graphics.off() # 현재 나와있는 그래프 제거 [문제157] exam.csv file에는 학생들의 시험점수가 있습니다. 학생들의 SQL 점수를 막대그래프로 출력해주세요. exam

R 2022.01.25

R dplyr, sqldf함수

더보기 ▣ 주요 키워드 ▣ dplyr summarise(n()), count,add_count, inner_join, left_join, right_join, full_join, semi_join, anti_join sqldf ⊙부서별 급여를 기준으로 내림차순 순위를 구하세요.(연이은순위) 1.ddply df % dplyr::select(EMPLOYEE_ID,LAST_NAME,SALARY,DEPARTMENT_ID)%>% # EMPLOYEE_ID,LAST_NAME,SALARY,DEPARTMENT_ID만 추출 dplyr::group_by(DEPARTMENT_ID)%>% #department_id로 그룹핑 dplyr::mutate(순위=dplyr::dense_rank(desc(SALARY)), #dense_r..

R 2022.01.21

R dplyr, rank 함수

더보기 ▣ 주요 키워드 ▣ dplyr filter, select, arrange, %>%(파이프), mutate, summarise rank rank옵션, dense_rank, min_rank ⊙ 부서별 최고 급여자들의 정보 출력 1.ddply a % #조건2 SALARY가 10000이상인 것 arrange(desc(SALARY),LAST_NAME) #대상컬럼이 위에 있는 컬럼만 사용가능 없으면 오류 , 조건3 SALARY를 내림차순, LAST_NAME을 오름차순으로 정렬 ▶ dplyr::mutate : 새로운 컬럼을 추가하는 함수, 미리 보기 # 컬럼추가 employees$ann_sal = 5000) employees%>% filter(DEPARTMENT_ID ==30 & SALARY >= 5000)%..

R 2022.01.20