'빅데이터 관련 자료/수학&x통계' 카테고리의 글 목록 (2 Page)
Data Analyst
300x250
300x250

빅데이터 관련 자료/수학&x통계 14

파이썬 데이터 분석을 위한 수학 & 통계 - 3회차 - 1

이산형 확률분포 1. 이산균일분포 - n 개의 결과값이 균일한 확률로 발생하는 확률분포 2. 이항분포 - 성공확률이 일정한 n회의 시행에서 나오는 성공 횟수의 확률분포 PDF 기댓값 분산 실습코드 import scipy.stats as spt import numpy as np import pandas as pd import matplotlib.pyplot as plt # Binomial distribution 이항분포 fig, ax = plt.subplots(1, 1) n=70; p=0.4; m,var,skw,kur=spt.binom.stats(n,p,moments='mvsk') #n 횟수, #moment print(m,var,skw,kur) x = np.arange(spt.binom.ppf(0.01, ..

파이썬 데이터 분석을 위한 수학 & 통계 - 2회차 - 2

확률변수 1. 확률변수의 기댓값 - 확률변수의 결과값을 그 확률 변수의 확률분포를 가중치로 평균한 값 - 확률실험을 무한히 반복했을 때 관측되는 확률변수 값들의 평균 이산형 연속형 기댓값의 특성 2. 분산과 표준편차 확률변수의 분산(variance) 분산의 특성 3. 공분산 두 확률변수의 공분산(covariance) 분산과 공분산의 특성 독립일 경우 공분산이 0이 된다. 4. 상관계수 두 확률변수의 상관계수(correlation coefficient) 상관계수를 하기위해 선형 관계이여야하며, 산점도를 통해 데이터의 형태가 특정한 경우(데이터가 산발적으로 흩어져있는 경우) 전처리를 해준다.

파이썬 데이터 분석을 위한 수학 & 통계 - 2회차 - 1

확률변수와 확률분포 1. 확률변수와 확률분포의 개념 확률변수: 표본공간의 각 원소를 실수 값으로 바꾸는 함수, 확률분포를 가짐 이산표본공간: 유한개 또는 셀 수 있는 무한개의 원소로 구성된 표본공간 이산확률변수: ex) 동전의 앞면이 나올 떄까지의 시행 횟수 연속표본공간: 실직선 상의 임의의 구간으로 나타낼 수 있는 표본 공간 연속확률변수: ex) 사람의 키와 몸무게, 제품의 수명 이산확률분포: 이산표본공간의 확률변수로부터 생성된 확률분포 확률질량함수(probability mass function) 연속확률분포(continuous probability distrubution) -연속적인 값을 갖는 확률변수의 확률분포 -확률분포함수 f(x)는 확률 P(a

파이썬 데이터 분석을 위한 수학 & 통계 - 1회차

모집단과 표본 정의 1) 모집단 통계분석의 연구대상이 되는 모든 개체들의 집합, 올바른 의사결정을 하기 위해 관심을 갖고 연구해야 할 대상 2) 모수 모집단의 특성을 나타내는 수치로서, 올바른 의사결정을 위해 특별히 관심을 갖는 모ㅜ만이 연구의 대상이 된다. ex) 평균, 분산, 표준편차, 비율 등 3) 표본 모집단의 특성을 파악하기 위해 모집단으로부터 일정한 규칙에 의해 추출한 모집단의 부분집합 4) 통계적 추론 모집단의 특성(평균, 분산, 비율 등)을 추측하는 것 ex) 추정(estimation), 가설검정(hypothesis test)-> 귀무가설: 반드시 보편적인 사실, 대립가설: 연구자가 원하는 바 5) 통계량 모집단의 특성(평균, 분산, 비율 등)을 추측하기 위해 사용하는 표본의 함수 6) 추..

300x250
300x250