본문 바로가기
기초통계학/기초확률론

7. 결합확률분포와 주변확률분포 (Joint Probability Function & Marginal Probability Function)

by -옌 2022. 12. 8.

 

 

 

 

확률변수가 두 개일 때의 분포결합누적분포함수 (joint cdf)를 알아보자.

(cdf를 먼저 정의하는 이유는 연속확률분포일 때 cdf -> pdf 순서로 구하기 때문이다.)

 

 

 

1. X와 Y가 이산확률변수일 때 

X와 Y가 이산확률변수일 때는 X와 Y에 대한 결합확률함수, 즉 결합확률질량함수를 바로 구할 수 있다. 

또한, 두 변수에 대한 함수인 결합확률함수 (결합확률질량함수)를 이용해 주변확률질량함수 (marginal pmf)를 구할 수 있다. 

즉, X와 Y에 대한 함수로 X에 대한 함수, Y에 대한 함수를 구할 수 있는 것이다. 

 

더보기

<X와 Y가 이산확률변수일 때>

Joint pmf -> Marginal pmf

 

 

2. X와 Y가 연속확률변수일 때 

X와 Y가 이산확률변수일 때는 X와 Y에 대한 누적분포함수를 통해 결합확률함수 (결합확률밀도함수)를 구할 수 있다.

또한, 두 변수에 대한 함수인 결합확률함수 (결합확률밀도함수)를 이용해 주변확률밀도함수 (marginal pdf)를 구할 수 있다. 

구하는 과정을 표현하면 아래와 같다.

더보기

<X와 Y가 연속확률변수일 때>

Joint cdf -> Joint pdf -> Marginal pdf

 

 

 

이제 두 확률 변수에 대한 함수에 대해 자세히 알아보자. 

연속확률변수에 관한 함수를 정의할 떄 누적분포확률을 먼저 정의한 이유는 cdf -> pmf 순서로 구해야 하기 때문이다.

 

 

 

두 확률변수에 대한 확률함수가 주어졌을 때 기댓값은 다음과 같다.

 

 

 

확률변수가 두개 주어졌을 때, 공분산과 상관계수를 구할 수 있다.

X와 Y의 상관계수(Correlation Coefficient)는 X와 Y가 얼마나 선형 관계를 가지고 있는지 보여주는 통계량이다.  

 

 

 

결합분포확률과 공분산, 상관계수를 이용한 예제를 풀어보자.

 

728x90

댓글