심화통계학/베이지안 방법론

4. 포아송-감마 모델(Poisson-Gamma random effect model)

-옌 2024. 4. 13. 23:16

 

 

 

1. 사후 분포 계산하기

사전분포가 감마분포, 관측 정보가 포아송 분포를 따를 때의 사후분포를 구하면 사후분포는 아래와 같은 감마분포가 된다. 

 

 

 

사후분포를 구하는 예제를 풀어보자.

아래의 표에서 관측치 개수 n은 50, y(사고건수)의 총합은 102임을 이용하면 된다.

 

 

 

아래는 위에서 얻은 사후분포로 도출해낸 평균값, 분산, 중간값이다. 

사후분포을 얻게 되어 좋은 점은, 업데이트한 확률분포(사후분포)로 평균값, 분산, 최빈값같은 대푯값들을 추정할 수 있다는 것이다.

특히 사후분포가 특성이 알려진 감마분포를 따르기 때문에 많은 값들을 알아낼 수 있다. 

 

 

 

2. 예측 분포 계산하기

앞에서는 관측치를 반영해 사전분포를 업데이트한 사후분포를 구했다.

이제는 사후분포를 바탕으로 새롭게 얻을 데이터 값 y를 예측해보자.

 

위에서 봤던 사전분포가 감마분포, 관측 정보가 포아송분포, 사후분포가 감마분포를 따를 때의 상황을 살펴보자.

구한 사후분포를 통해 새롭게 얻을 데이터 y의 분포, 평균값, 분산을 구할 수 있다.

예측분포가 음이항분포(negative binomial distribution)을 따른다는 것을 알 수 있고, 이를 이용해 예측분포의 평균, 분산까지 구할 수 있다. 

 

 

 

예측분포에 관련된 공식을 증명하는 과정은 다음과 같다. 

 

 

 

보험사 영업사원이 판매하는 보험 상품의 수에 관한 사후분포와 예측분포를 계산하는 예제를 풀어보자.

사후분포와 예측분포를 직접 계산으로 도출해도 되고, 위에서 도출해낸 공식에 대입해서 풀어도 된다. 

 

 

<정리>

사전분포 관측치 정보 사후 분포 예측 분포
감마분포
(Gamma distribution)
포아송분포
(Poisson distribution)
감마분포
(Gamma distribution)
음이항분포
(Negative Binomial distribution)

 

 

 

 

728x90