통계적 추론
추출된 표본으로 모집단의 일반적인 특성을 추론
평균, 분산, 표준편차 등을 알 수 있다.
모집단의 특성을 알기위해 표본을 조사하는 것
- 모수의 추정 Estimation : 미지수인 모수에 대한 추측, 추측치를 수치화된 정확도와 제시
- 모수에 대한 가설검정 Statistical Hypothesis Test : 모수에 대한 여러 가설이 적합한지를 판단
Q) 청소년 성장 연구를 위해 중학생 30명을 임의 추출하여 키를 측정하였다. 도시 전체의 중학생의 평균기를 추론한다.
- 점추정 : 평균을 하나의 값으로 추정
- 구간추정 : 평균을 포함하는 적당한 구간을 제시
- 가설검정 : 평균이 5년전 평균값과 다른지 판단
점 추정 Point Estimation
평균을 하나의 값으로 추정할 때 점 추정을 사용
모집단에서 n개 추정된 표본에서 모수의 값이라고 예상하는 하나의 값을 제시
정규분포 모집단, 대표본 ( n>=30 )
- 표본평균이 정규분포를 따른다.
- 표본평균이 점추정 값이 된다.
모수 : 모집단의 평균
추정량 : 표본평균
표준오차 : Var(n)/√n
추정된 표준오차 : s/√n
import numpy as np
samples = [ 9, 4, 0, 8, 1, 3, 7, 4, 2 ]
np.mean(samples)
구간추정 Interval Estimation
추정량의 분포를 이용해 표본으로 부터 모수인 평균값을 포함하는 신뢰구간을 제시
신뢰구간 Confidence Interval
- 신뢰 구간을 가능한 줄여야 한다
- 신뢰구간이 모수를 포함할 확률을 1보다는 작은, 일정한 수준에서 유지시키며 구간의 길이를 줄이는 것이 신뢰구간을 만드는 기초
(L, U)
신뢰수준 Level of Confidence
신뢰구간에 모수를 포함할 확률
- 90%, 99%, 95% ..
- 100(1-a)%
표본의 크기가 클 경우 (n>=30) 중심극한정리를 사용한다
S : 표본표준편차
표준편차가 작을수록 신뢰 구간의 길이가 짧아지고, 신뢰수준을 높일수록(a가 작아질 수록) 신뢰구간의 길이가 길어진다.
표본의 크기가 클수록 신뢰 구간의 길이가 짧아져서 평균치를 정확히 알 수 있다.
Q) 고1 남학생의 평균키를 추정하기 위해 36명을 표본으로 추출하여 표본평균, 표본표준편차가 다음과 같을때
표본평균 = 173.6 표본표준편차 = 3.6
95% 신뢰구간을 구하면
100(1-a) = 95
a = 1 - 0.95
a = 0.05
Za/2 = Z0.025 = 1.96
(173.6 - 1.96(3.6/√36), 173.6 + 1.96(3.6/√36))
(173.6 - 1.176, 173.6 + 1.176)
A) (172.4, 174.8)
'Mathematics for ai > 확률 통계학 Statistics' 카테고리의 다른 글
통계적 가설검정 Statistical Hypothesis Test (0) | 2021.12.17 |
---|---|
추정 Estimation 모비율의 추정 (0) | 2021.12.17 |
표본분포 Sampling Distribution (0) | 2021.12.17 |
지수분포 Exponential Distribution (0) | 2021.12.16 |
포아송 분포 Poisson Distribution (0) | 2021.12.16 |