파이썬 합, 평균, 분산, 표준편차, Feature Scailing(표준화, 정규화)

PYTHON

파이썬 합, 평균, 분산, 표준편차, Feature Scailing(표준화, 정규화)

Positive_Monster 2022. 4. 9. 17:03

▣ 주요 키워드 ▣

합, 평균, 분산, 표준편차
Feature Scailing
- 표준화
- 정규화

★ 합, 평균, 분산, 표준편차

> 합 = 관측값의 합
> 평균 : 관측값의 합 / 관측값의 수
> 분산 : 편차제곱합 / 관측값의 수
	※ 편차제곱합 :  편차**2 + 편차**2 .... (편차제곱들의 합)
	※ 편차 : 관측값 - 평균
> 표준편차 : 루트(분산)


def sum(*arg):
    total = 0
    for i in arg:
        total += i
    return total

sum(1,2,3,4,5)

def mean(*arg):
    return sum(*arg)/len(arg)

mean(1,2,3,4,5)

def variance(*arg):
    total = 0
    for i in arg:
        total += (i - mean(*arg))**2
    return total/(len(arg))

variance(1,2,3,4,5)

import math
def stddev(*arg):
    return math.sqrt(variance(*arg))

stddev(1,2,3,4,5)

> numpy를 이용하여 간단히 계산할 수 있다
import numpy as np

x = 1,2,3,4,5
np.sum(x) # 합
np.mean(x) # 평균 
np.var(x) # 분산
np.std(x) # 표준편차

★ Feature Scailing

1. 표준화(standardization)

- z-score : (관측값 - 관측값의 평균) / 관측값의 표준편차

- 서로 다른 변수의 값 범위를 일정한 수준으로 맞추는 작업(feature들의 범위를 정규화)

data = 100,5,2,1,8,7,11,15,18,200

def standardization(*arg):
    data2 = []
    for i in arg:
        data2.append((i- mean(*arg))/stddev(*arg))
    return data2
    
standardization(*data)
# 각 값들을 표준화 한 값들

2. 정규화(nomalization)

- 서로 다른 피처의 크기를 동일한 크기로 변환해주는 개념

- 0~1 값으로 변환하는 방법

- (관측값 - 관측값의 최솟값) / (관측값의 최댓값 - 관측값의 최솟값)

※ 최대값 
def max_(*arg):
    temp = arg[0]
    for i in arg:
        if temp < i:
            temp = i
        else:
            continue
    return temp
    
max_(*data) # 만든 함수
max(data) # 내제되어있는 함수

※ 최소값
def min_(*arg):
    temp = arg[0]
    for i in arg:
        if temp > i:
            temp = i
        else:
            continue
    return temp
    
min_(*data)
min(data)

정규화

def nomalization(*arg):
    data2 = []
    for i in arg:
        data2.append((i-mean(*arg))/(max(data) - min(data)))
    return data2
    
nomalization(*data)

'PYTHON' 카테고리의 다른 글

파이썬 파일 읽고 쓰기(open, close, write, read, with, csv, pickle) (0)	2022.04.15
파이썬 날짜 함수 (0)	2022.04.15
파이썬(스택,pop,enumerate,큐) (0)	2022.04.02
파이썬(operator.itemgetter,리스트 내장객체, 함수) (0)	2022.04.02
파이썬(반복문,collections) (0)	2022.03.27

현재글파이썬 합, 평균, 분산, 표준편차, Feature Scailing(표준화, 정규화)

배움에 대한 열정과 끈기

2024년을 맞이하여 다시 시작하는 T-Story 공부하는 모든 데이터 분석 지식들과 IT지식들을 하나씩 꾸준히 기록.

빅데이터분석가, 전처리, 자격증, R, 머신러닝, 데이터분석, SQL, 데이터, 빅데이터, 데이터베이스, 프로그래밍, It, 파이썬, 딥러닝, Python, SQLD, 오라클, 통계, 빅데이터분석, R프로그래밍,

Today :
Yesterday :

일	월	화	수	목	금	토
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

배움에 대한 열정과 끈기

파이썬 합, 평균, 분산, 표준편차, Feature Scailing(표준화, 정규화)

★ 합, 평균, 분산, 표준편차

★ Feature Scailing

'PYTHON' 카테고리의 다른 글

'PYTHON'의 다른글

티스토리툴바

개인정보

단축키

내 블로그

블로그 게시글

모든 영역

파이썬 합, 평균, 분산, 표준편차, Feature Scailing(표준화, 정규화)

★ 합, 평균, 분산, 표준편차

★ Feature Scailing

'PYTHON' 카테고리의 다른 글

'PYTHON'의 다른글

관련글

티스토리툴바

개인정보

단축키

내 블로그

블로그 게시글

모든 영역