확률변수와 확률분포
1. 확률변수와 확률분포의 개념
확률변수: 표본공간의 각 원소를 실수 값으로 바꾸는 함수, 확률분포를 가짐
이산표본공간: 유한개 또는 셀 수 있는 무한개의 원소로 구성된 표본공간
이산확률변수: ex) 동전의 앞면이 나올 떄까지의 시행 횟수
연속표본공간: 실직선 상의 임의의 구간으로 나타낼 수 있는 표본 공간
연속확률변수: ex) 사람의 키와 몸무게, 제품의 수명
이산확률분포: 이산표본공간의 확률변수로부터 생성된 확률분포
확률질량함수(probability mass function)


연속확률분포(continuous probability distrubution)
-연속적인 값을 갖는 확률변수의 확률분포
-확률분포함수 f(x)는 확률 P(a<x<b)를 구하기 위한 확률밀도함수


누적분포함수(cumulative distrubution function)
- 확률변수 x가 특정한 값 x 이하일 확률

2. 결합확률분포(joint prob. dist. function)
두 개 이상의 확률변수를 다루어야 할 떄는 확률변수 간에 서로 영향을 주고받을 수 있으므로 동시에 고려할 필요가 있다.
결합확률분포의 개념
- 2개 이상의 확률변수에 대한 확률분포
- 이산형 결합확률분포: 두 확률변수 X와 Y가 동시에 각각 x와 y의 값을 가질 확률



- 연속형 결합확률변포: 두 확류변수 X와 Y의 확률을 계산하기 위한 밀도함수



3. 주변확률분포(marginal probability distribution)
- 이산형

- 연속형


4. 조건부확률분포

5. 확률변수의 독립(statistically independent)
통계적 독립: 확률변수 X와 Y가 통계적으로 독립이기 위한 필요충분조건

통계적 독립 조건
- 두 확률변수와 X와 Y의 결합분포함수 f(x,y)=g(x)h(y) 형태
- X와 Y의 정의역이 서로 간섭받지 않는다.
6. 확률변수의 변환 ***
- 왜 변환을 해야될까? 구하고 싶은걸 쉽게 구하기 위해! ex) 지수 -> 로그 변환
- 누적분포함수법(method of CDF)
기존 확률변수의 확률분포로부터 새로운 확률변수의 누적분포함수를 계산한 후, 이를 미분하여 확률밀도함수를 구하는 방법
- 변수변환법(method of transformation)
확률변수 X와 Y가 일대일 관계인 경우, Y의 역함수를 구하여 X의 확률밀도함수에 대입하여 구하는 방법
- TIP: 분석을 하기위해서는 근거에 대해 뒷받침될 수 있는 정규성, 독립성이 꼭 필요하다.
내가 주장하려는 건 대립가설, 원래 있던 주장은 귀무가설로 설정한다.
CONVOLUTION: 합성곱, g(x)h(x)에서 뒤에 있는 함수 h(x)를 반전시켜 곱해 적분하는거
'빅데이터 관련 자료 > 수학&x통계' 카테고리의 다른 글
파이썬 데이터 분석을 위한 수학 & 통계 - 3회차 - 3 (0) | 2021.08.17 |
---|---|
파이썬 데이터 분석을 위한 수학 & 통계 - 3회차 - 2 (0) | 2021.08.17 |
파이썬 데이터 분석을 위한 수학 & 통계 - 3회차 - 1 (0) | 2021.08.17 |
파이썬 데이터 분석을 위한 수학 & 통계 - 2회차 - 2 (0) | 2021.08.11 |
파이썬 데이터 분석을 위한 수학 & 통계 - 1회차 (0) | 2021.08.09 |