확률론과 통계학에서 정규 분포(正規 分布, 영어: normal distribution) 또는 가우스 분포(Gauß 分布, 영어: Gaussian distribution)는 연속 확률 분포의 하나이다. 정규분포는 수집된 자료의 분포를 근사하는 데에 자주 사용되며, 이것은 중심극한정리에 의하여 독립적인 확률변수들의 평균은 정규분포에 가까워지는 성질이 있기 때문이다.
정규분포는 2개의 매개 변수 평균와 표준편차에 대해 모양이 결정되고, 이때의 분포를 로 표기한다. 특히, 평균이 0이고 표준편차가 1인 정규분포 을 표준 정규 분포(standard normal distribution)라고 한다.[1]
역사
정규분포는 아브라암 드무아브르가 1733년 쓴 글에서 특정 이항 분포의 이 클 때 그 분포의 근사치를 계산하는 것과 관련하여 처음 소개되었고 이 글은 그의 저서 《우연의 교의》(The Doctrine of Chances) 2판(1738년)에 다시 실렸다. 피에르시몽 라플라스는 그의 저서 《확률론의 해석이론》(Théorie analytique des probabilités)(1812년)에서 이 결과를 확장하였고 이는 오늘날 드무아브르-라플라스의 정리로 알려져있다.
정규분포는 중앙치에 사례 수가 모여있고, 양극단으로 갈수록 X축에 무한히 접근하지만 X축에 닿지는 않는다.[2]
표준 정규 분포
정규 분포 밀도 함수에서 를 통해 X(원점수)를 Z(Z점수)로 정규화함으로써 평균이 0, 표준편차가 1인 표준정규분포를 얻을 수 있다.[1]
z-분포라고도 부른다. z-분포로 하는 검정(test)을 z검정(z-test)이라고 한다.
불확실성
에서 k값이 변화함에 따라 구해지는 값을 불확실성(uncertainty)이라고 한다. 예를 들어 를 90% 불확실성, 는 95% 불확실성, 은 99% 불확실성이다. 특히, 를 50% 불확실성이라고 하며, 확률오차(probable error)라고도 한다.[3] 이는 관측값이 전체 관측값의 50%에 있을 확률을 의미한다.[4]