본문 바로가기
심화통계학/베이지안 방법론

3. 베르누이-베타 모델(Bernoulli-Beta random effect model)

by -옌 2024. 4. 10.

 

 

1. 사후 분포 계산하기

이전까지 사전분포에 새로 얻게 된 정보를 결합해 사후분포를 추정하는 베이지안 방법을 살펴보았다.

앞에서 배웠던 예시를 아래 예제에 적용해보자.

 

 

 

베르누이-균일 모델(Bernoulli-Uniform random effect model)

아래의 새로운 교육방법이 효과가 있는지 알아보기 위해 40명의 어린이들을 표본으로 삼아 조사한 사례이다. 

변수 Xi를 i번째 어린이에게 효과가 있으면 1, 아니면 0 값을 갖는다고 정의하고, Xi는 베르누이 분포를 따른다고 볼 수 있다. 

총 15명에게 효과가 있고, 25명에게는 효과가 없다는 결과가 나왔고, 이 정보를 새롭게 반영해 사후 분포를 구하면 된다. 

결론적으로 사전 분포가 균일 분포, 관측치가 베르누이 분포를 따를 때 사후 분포는 베타 분포를 따른다는 것을 알 수 있다. 

 

 

 

아래는 위에서 얻은 사후분포로 평균값, 분산, 중간값을 구하는 예제이다. 

사후분포을 얻게 되어 좋은 점은, 업데이트한 확률분포(사후분포)로 평균값, 분산, 중앙값같은 대푯값들을 추출할 수 있다는 것이다.

특히 이 사례에는 사후분포가 특성이 알려진 베타분포를 따르기 때문에 많은 값들을 알아낼 수 있다. 

 

 

 

베르누이-베타 모델 (Bernoulli-Beta random effect model)

위에서 사전분포와 관측치가 따르는 분포를 통해 사후 분포를 알아냈던 것처럼 아래 문제를 계산하자.

위에서 사용했던 균일분포는 Beta(1,1) 분포와 같으므로, 이를 확장해 일반적인 베타 분포도 베르누이분포와 결합했을 때 베타분포가 나온다는 것을 보일 수 있다. 

아래와 같은 계산 과정을 통해 증명해보이자.

 

 

 

위에서 얻은 공식을 통해 사후 분포를 복잡한 계산 없이 간단하게 계산해보자.

1(성공)의 개수가 5개, 0(실패)의 개수가 5회인 관측치가 주어졌으므로 사후분포는

Beta(16+5, 26+5) = Beta(21, 31)을 따른다. 

 

 

 

베르누이-베타 모델의 공식을 이용해 사후분포를 구하고 R에서 그래프로 표현해보자.  

검은색 그래프가 사전확률분포, 빨간색 그래프가 새롭게 얻은 정보를 반영한 사후확률분포이다.

새로운 정보로 업데이트했을 때 확률분포가 달라진다는 것을 알 수 있다.

## R코드
x = seq(0, 1, 0.01) # 그래프에 나타낼 x값 설정

y_prior = dbeta(x, shape1=16, shape2=26) # 사전확률 설정 (베타 분포)
plot(x,y_prior,type="l") # 사전확률을 그래프로 표현하기

y_post = dbeta(x, shape1=21, shape2=31) # 사후확률 설정 (베타 분포)
points(x, y_post, type="l", col=2) # 사후확률을 그래프로 표현하기

 

 

 

 

2. 예측 분포 계산하기

앞에서는 관측치를 반영해 사전분포를 업데이트한 사후분포를 구했다.

이제는 사후분포를 바탕으로 새롭게 얻을 데이터 값 y를 예측해보자.

 

위에서 봤던 사전분포가 베타 분포, 관측치가 베르누이 분포, 사후분포가 베타 분포를 따를 때의 상황을 살펴보자.

구한 사후분포를 통해 새롭게 얻을 데이터 y(n+1)의 확률, 평균값, 분산을 구할 수 있다.

 

참고)

아래는 식을 전개할 때 쓰이는 double conditional expectation (이중 조건부확률 기댓값) 공식이다. 

 

 

1, ... , 12번까지의 데이터를 알 때 13번째 데이터의 예측확률을 구하는 문제를 풀어보자.

(여기서는 사전분포에 관한 정보가 없으므로 사전분포를 Beta(1,1) = Unif(0,1)로 가정한다. )

 

 

<정리>

사전확률의 분포 관측치의 분포 사후확률의 분포
균일 분포 (uniform distribution) 베르누이 분포 (Bernoulli distribution) 베타 분포 (Beta distribution)
베타 분포 (Beta distribution) 베르누이 분포 (Bernoulli distribution) 베터 분포 (Beta distribution)

 

주의!) 균일분포는 Beta(1,1) 분포로 Beta 분포의 특수한 경우에 해당한다. 즉, 균일분포는 베타분포에 속하므로, 베르누이 분포와 결합되었을 때 베타 분포가 나올 수밖에 없는 것이다. 

 

 

728x90

댓글