전자공학

이항 분포(Binomial distribution) & 포아송 분포(Poisson distribution)

-_-!!!!-_-!!!!-_-!!!!-_-!!!! 2020. 12. 27. 09:27

앞서우리는 베르누이 시행에 대해 배웠었습니다. 베르누이 시행이란, 두가지 결과만 가지는 실험을 n번 반복하여 두가지 결과중 한 결과가 k번 나타날 확률을 구하는 것 이었습니다. 이항 분포는 이 베르누이 시행과 큰 연관성이 있습니다. 이항 분포란, 이러한 베르누이 시행을 통해 얻은 확률에 대한 이산확률분포입니다.

 

먼저 이항밀도함수(binomial density function)에 대해 알아보겠습니다. pdf(확률밀도함수)는 미소확률/미소구간 으로 정의했었습니다. 이항밀도함수(Binomial density function)는 이항분포의 확률밀도함수로써, 이산확률분포이기 때문에 각 구간의 특정한 값에 대한 확률의 분포로써 정의됩니다. 식으로 써보면 다음과 같습니다.

 

베르누이 시행의 식에 unit impulse function이 곱해져 있는 식이 급수형태로 표현이 되어 있습니다. 따라서 모든 구간에 대한 그래프를 그려보면 일반적으로 다음과 같은 형태가 그려집니다.

 

이항 밀도함수 그래프는 보통 평균을 중심으로 왼쪽면은 경사가 가파른 반면 오른쪽면은 경사가 완만해 지는 특징을 가집니다.  또한 이항밀도함수를 적분하면 이항분포함수(binomial distribution function)이 되며 식은 아래와 같습니다.

 

만약 n(시행횟수)가 매우 크다면 위의 이항분포를 이용하기가 힘듭니다. 가령 예를들어 1년동안 비행기사고가 일어날 확률에 대한 이항분포를 구하고 싶다면, n이 매우크므로 계산하기가 상당히 복잡해집니다. 따라서 이렇게 n이 매우 클 때 포아송(Poisson) 분포를 사용합니다.

 

포아송 분포는 시행횟수(n)이 무한대이며, 일어날 확률 p는 매우 작을 때에만 구할 수 있습니다. 포아송은 실제로 기병들이 말에서 떨어지는 확률분포에 대하여 연구하였는데, 시행횟수를 측정하기가 사실상 불가능 했기에 이러한 포아송 분포를 만들어 내었습니다. 포아송 분포에 대한 식을 유도하는 과정은 아래와 같습니다.

 

따라서 평균만 알고 있다면, 포아송 분포를 그릴 수 있습니다. 포아송 분포의 밀도함수와 분포함수는 다음과 같습니다.

 

포아송 분포는 이항분포와 같은 그래프의 형태를 가지고 있습니다. 또한 포아송 분포같은 경우엔 정말 랜덤한 현상인지 아닌지에 대하여 감지하는데 사용됩니다. 예를들어 랜덤한 현상 중 하나인 비행기 사고의 포아송 분포가 포아송 분포형태의 그래프를 가지지 않는다면 비행기 사고가 랜덤하지 않고 의도적으로 발생했다는 것을 말해줍니다. 또한 포아송 분포를 시간에 대해서 보면 event가 몰려서 나오게 되는 특징이 있습니다. 그 이유는 랜덤한 사건을은 몰려서 일어나기 때문입니다. 이것은 실제로 수학적으로도 증명이 되었다고 합니다. 따라서 안좋고 힘든일이 연달아 일어나더라도 힘내서 견디다 보면 좋은날이 올 것 입니다. 만약 안좋은 일이 한달간격으로 주기적으로 나타난다면 그 안좋은 일은 랜덤한 사건이 아닌 의도적일 가능성이 크므로 반드시 의심해봐야 합니다.