파이썬 데이터 분석을 위한 수학 & 통계 - 2회차 - 1
잡학다식의 지식공방

빅데이터 관련 자료/수학&x통계

파이썬 데이터 분석을 위한 수학 & 통계 - 2회차 - 1

carpe08 2021. 8. 11. 16:21
320x100

확률변수와 확률분포

1. 확률변수와 확률분포의 개념

 

확률변수표본공간의 각 원소를 실수 값으로 바꾸는 함수, 확률분포를 가짐

 

이산표본공간: 유한개 또는 셀 수 있는 무한개의 원소로 구성된 표본공간

 

이산확률변수: ex) 동전의 앞면이 나올 떄까지의 시행 횟수

 

연속표본공간: 실직선 상의 임의의 구간으로 나타낼 수 있는 표본 공간

 

연속확률변수: ex) 사람의 키와 몸무게, 제품의 수명

 

이산확률분포: 이산표본공간의 확률변수로부터 생성된 확률분포

 

확률질량함수(probability mass function)

 

 

연속확률분포(continuous probability distrubution)

-연속적인 값을 갖는 확률변수의 확률분포

-확률분포함수 f(x)는 확률 P(a<x<b)를 구하기 위한 확률밀도함수

 

누적분포함수(cumulative distrubution function)

- 확률변수 x가 특정한 값 x 이하일 확률

 

2. 결합확률분포(joint prob. dist. function)

두 개 이상의 확률변수를 다루어야 할 떄는 확률변수 간에 서로 영향을 주고받을 수 있으므로 동시에 고려할 필요가 있다.

 

결합확률분포의 개념

- 2개 이상의 확률변수에 대한 확률분포

- 이산형 결합확률분포: 두 확률변수 X와 Y가 동시에 각각 x와 y의 값을 가질 확률

 

- 연속형 결합확률변포: 두 확류변수 X와 Y의 확률을 계산하기 위한 밀도함수

 

3. 주변확률분포(marginal probability distribution)

 

- 이산형

- 연속형

4. 조건부확률분포

 

5. 확률변수의 독립(statistically independent)

 

통계적 독립: 확률변수 X와 Y가 통계적으로 독립이기 위한 필요충분조건

통계적 독립 조건

- 두 확률변수와 X와 Y의 결합분포함수 f(x,y)=g(x)h(y) 형태

- X와 Y의 정의역이 서로 간섭받지 않는다.

 

 

6. 확률변수의 변환 ***

 

- 왜 변환을 해야될까? 구하고 싶은걸 쉽게 구하기 위해! ex) 지수 -> 로그 변환

 

- 누적분포함수법(method of CDF)

기존 확률변수의 확률분포로부터 새로운 확률변수의 누적분포함수를 계산한 후, 이를 미분하여 확률밀도함수를 구하는 방법

 

- 변수변환법(method of transformation)

확률변수 XY가 일대일 관계인 경우, Y의 역함수를 구하여 X의 확률밀도함수에 대입하여 구하는 방법

 

 

- TIP: 분석을 하기위해서는 근거에 대해 뒷받침될 수 있는 정규성, 독립성이 꼭 필요하다.

        내가 주장하려는 건 대립가설, 원래 있던 주장은 귀무가설로 설정한다.

        CONVOLUTION: 합성곱, g(x)h(x)에서 뒤에 있는 함수 h(x)를 반전시켜 곱해 적분하는거

 

320x100
320x100