sailorCat
작성일
2021. 12. 17. 16:59
작성자
sailorCat
728x90

통계적 추론 

 

추출된 표본으로 모집단의 일반적인 특성을 추론

평균, 분산, 표준편차 등을 알 수 있다.

모집단의 특성을 알기위해 표본을 조사하는 것

 

- 모수의 추정 Estimation : 미지수인 모수에 대한 추측, 추측치를 수치화된 정확도와 제시

- 모수에 대한 가설검정 Statistical Hypothesis Test : 모수에 대한 여러 가설이 적합한지를 판단

 

Q) 청소년 성장 연구를 위해 중학생 30명을 임의 추출하여 키를 측정하였다. 도시 전체의 중학생의 평균기를 추론한다.

- 점추정 : 평균을 하나의 값으로 추정 

- 구간추정 : 평균을 포함하는 적당한 구간을 제시

- 가설검정 : 평균이 5년전 평균값과 다른지 판단

 

점 추정 Point Estimation

 

평균을 하나의 값으로 추정할 때 점 추정을 사용

모집단에서 n개 추정된 표본에서 모수의 값이라고 예상하는 하나의 값을 제시

 

정규분포 모집단, 대표본 ( n>=30 )

- 표본평균이 정규분포를 따른다.

- 표본평균이 점추정 값이 된다.

 

모수 : 모집단의 평균

추정량 : 표본평균

표준오차 : Var(n)/√n

추정된 표준오차 : s/√n

 

import numpy as np

samples = [ 9, 4, 0, 8, 1, 3, 7, 4, 2 ]

np.mean(samples)

 

구간추정 Interval Estimation

 

추정량의 분포를 이용해 표본으로 부터 모수인 평균값을 포함하는 신뢰구간을 제시

 

신뢰구간 Confidence Interval

- 신뢰 구간을 가능한 줄여야 한다

- 신뢰구간이 모수를 포함할 확률을 1보다는 작은, 일정한 수준에서 유지시키며 구간의 길이를 줄이는 것이 신뢰구간을 만드는 기초

(L, U)

 

신뢰수준 Level of Confidence

신뢰구간에 모수를 포함할 확률

- 90%, 99%, 95% ..

- 100(1-a)%

 

표본의 크기가 클 경우 (n>=30) 중심극한정리를 사용한다

S : 표본표준편차

 

표준편차가 작을수록 신뢰 구간의 길이가 짧아지고, 신뢰수준을 높일수록(a가 작아질 수록) 신뢰구간의 길이가 길어진다.

표본의 크기가 클수록 신뢰 구간의 길이가 짧아져서 평균치를 정확히 알 수 있다.

 

Q) 고1 남학생의 평균키를 추정하기 위해 36명을 표본으로 추출하여 표본평균, 표본표준편차가 다음과 같을때

표본평균 = 173.6 표본표준편차 = 3.6

95% 신뢰구간을 구하면

 

100(1-a) = 95

a = 1 - 0.95

a = 0.05

Za/2 = Z0.025 = 1.96

(173.6 - 1.96(3.6/√36), 173.6 + 1.96(3.6/√36))

(173.6 - 1.176, 173.6 + 1.176)

 

A) (172.4, 174.8)

 

 

 

728x90