파이썬 데이터 분석을 위한 수학 & 통계 - 3회차 - 2
Data Analyst

빅데이터 관련 자료/수학&x통계

파이썬 데이터 분석을 위한 수학 & 통계 - 3회차 - 2

carpe08 2021. 8. 17. 16:45
320x100
320x100

표본의 분포

1. 통계량과 추정량

확률표본(random sample)

독립적이며 동일한 분포를 따르는 (iid: independent and identically distributed) 확률변수들의 집합

 

통계량(statistic)

미지의(unknown) 모수를 포함하지 않는 확률표본의 함수

 

추정량(estimator)

미지의 모수를 추정하기 위한 통계량

 

불편성(unbiasedness)

추정량의 기댓값이 추정하고자 하는 모수와 같아지는 특성으로서, 좋은 추정량이 되기 위한 첫 번째 요건

 

정규 모집단에서 일정한 개수의 확률표본으로 만들 수 있는 모평균에 대한 불편추정량 중 표본평균의 분산이 최소(UMVUE)

 

2. 중심극한정리

표본평균의 분포가 정규분포로 근사

 

단일 모집단에 대한 추론

구간추정

신뢰구간(confidence interval)

모수의 참값을 포함할 확률이 신뢰수준 1-α가 되는 구간

 

신뢰수준(confidence level)

신뢰구간이 모수의 참값을 포함할 확률 (1-α)

※ 모수가 신뢰구간에 들어갈 확률이 절대 아니다!!

 

유의수준(significance level)

신뢰구간이 모수의 참값을 포함하지 못할 확률 (α)

 

가설검정

귀무가설(null hypothesis) H0

기존의 통념, 기각할만한 명백한 사유가 입증되지 않는 한 채택

 

대립가설(alternative hypothesis) H1

새로운 주장, 표본 데이터로부터 확실한 근거가 제시되어야 채택

 

1종 오류(type 1 error)

절대 건드리지말기! 주로 제2종 오류를 조절한다.

귀무가설이 맞는데도 불구하고 이를 기각하는 오류

 

2종 오류(type 2 error)

대립가설이 맞는데도 불구하고 귀무가설을 채택하는 오류

유의수준(significance level)

1종 오류가 발생할 확률, α 이하로 제한됨

 

검정통계량(test statistic)

가설검정을 위해 사용되는 통계량

 

기각역(rejection area)

귀무가설을 기각하는 검정통계량의 영역

 

임계점(critical point), 기각치 (critical value)

기각역의 경계치

 

p-값

귀무사것리 참인데도 우연히 그런 관측치가 나올 확률

P< 유의수준(알파, 보통 0.05)보다 낮을 때 기각

 

 

320x100
320x100