평균 Average
모평균
- 모집단 전체의 평균
표본 평균
- 모집단에서 추출한 표론의 평균
import statistics
statistics.mean(a)
중앙값 Median
평균의 경우 극단 값의 영향을 많이 받음
[50,60,70,1000]
- 주어진 자료를 높은 쪽 절반과 낮은 쪽 절반으로 나누는 의미
- 자료를 순서대로 나얼했을 때 중앙 값
홀수 (n+1)/2
짝수 n/2와 (n/2)+1의 평균
statistics.median(b)
분산 Variance
- 편차의 제곱의 합을 자료의 수로 나눈값
- 값과 평균의 차이
- 얼마나 퍼져 있는지
모분산
- 모집단 전체의 분산
표본 분산
- 모집단에서 추출한 표론의 분산
statistics.pvariance(a) 모분산
statistics.variance(c) 표본분산
import scipy
scipy.stats.tvar(a) 표본분산
import numpy
numpy.var(a) 모분산
numpy.var(a, ddof=1) 표본분산
ddof Delta Degrees of Freedom
표준편차 Standard Deviation
- 분산의 양의 제곱근
모표준편차 Population standard deviation
- 모집단 전체의 표준편차
표본표준편차 Sample standard deviation
- 모집단에서 추출한 표본의 표준편차
statistics.pstdev(a) 모표준편차
statistics.stdev(a) 표본표준편차
numpy.std(a) 모표준편차
numpy.std(a, ddof=1) 표본표준편차
ddof Delta Degrees of Freedom
범위 Range
- 자료값에서 최댓값과 최솟값의 차이
max(a) - min(a)
numpy.max(a) - numpy.min(a)
사분위 수 Quartile
- 전체 자료를 정렬했을 때 1/4, 1/2, 3/4 위치에 있는 값Q1 1/4Q2 2/4 = 1/2 = Median Q2는 쓰지 않는다Q3 3/4
사분위 범위 IQR Interquartile Range- Q3 - Q1
numpy.quantile(a, .25) Q1
numpy.quantile(a, .5) Q2 = Median
numpy.quantile(a, .75) Q3
numpy.quantile(a, .60) random num
numpy.quantile(a, .75) - numpy.quantile(a, .25) 사분위범위
Z - Score
- 어떤 값이 평균으로부터 몇 표준편차가 차이나는지 z = (값 - 평균)/표준편차
scipy.stats.zscore(a)
'Mathematics for ai > 확률 통계학 Statistics' 카테고리의 다른 글
이항분포 Binomial Distribution (0) | 2021.12.16 |
---|---|
확률변수 Random Variable (0) | 2021.12.16 |
여사건 Complementary Event (0) | 2021.12.16 |
확률 Probability 조건부 확률 Conditional Probability (0) | 2021.12.16 |
통계학 기본개념 (0) | 2021.12.15 |