파이썬 데이터 분석을 위한 수학 & 통계 - 1회차
잡학다식의 지식공방

빅데이터 관련 자료/수학&x통계

파이썬 데이터 분석을 위한 수학 & 통계 - 1회차

carpe08 2021. 8. 9. 16:44
320x100

모집단과 표본

정의

1) 모집단

통계분석의 연구대상이 되는 모든 개체들의 집합, 올바른 의사결정을 하기 위해 관심을 갖고 연구해야 할 대상

2) 모수

모집단의 특성을 나타내는 수치로서, 올바른 의사결정을 위해 특별히 관심을 갖는 모ㅜ만이 연구의 대상이 된다.

ex) 평균, 분산, 표준편차, 비율 등

 

3) 표본

모집단의 특성을 파악하기 위해 모집단으로부터 일정한 규칙에 의해 추출한 모집단의 부분집합

 

4) 통계적 추론

모집단의 특성(평균, 분산, 비율 등)을 추측하는 것

ex) 추정(estimation), 가설검정(hypothesis test)-> 귀무가설: 반드시 보편적인 사실, 대립가설: 연구자가 원하는 바

 

5) 통계량

모집단의 특성(평균, 분산, 비율 등)을 추측하기 위해 사용하는 표본의 함수

 

6)  추정량

모수를 추정하는데 사용하는 통계량

ex) 표본평균, 표본분산, 표본비율 등


데이터의 종류

데이터의 척도의 유형

명목척도

순서, 크기 등의 의미는 없다.

ex) 교과코드, 차번호, 성별주민번호 뒷자리, 복권번호

 

순서척도

순서의 의미는 있으나, 간격의 의미는 없다.

ex) 직급, 계급, 우선순위, 선호도

 

구간척도

순서와 간격의 의미는 있으나, 비율의 의미는 없다.

ex) 대기표번호, 화씨온도, 지능지수, 표준점수

 

비율척도

순서, 간격, 비율 등의 의미가 모두 있다.

ex) 농도, 무게, 길이, 압력,속도, 지지율

 


통계적 의사결정 절차

참고: 대부분 우리가 분석하는 것은 모수가 아니라 표본이라고 보면 좋다.

 

데이터의 정리와 요약

1. 도수분포표

2. 체크시트

3. 히스토그램

4. 줄기 - 잎 그림

5. 상자 그림

6. 산점도

7. 중심위치의 척도

8. 산포의 척도

 

확률

1. 표본공간과 사상

2. 확률의 정의

3. 조건부 확률

4. 베이즈 정리

320x100
320x100