확률변수가 두 개일 때의 분포와 결합누적분포함수 (joint cdf)를 알아보자.
(cdf를 먼저 정의하는 이유는 연속확률분포일 때 cdf -> pdf 순서로 구하기 때문이다.)
1. X와 Y가 이산확률변수일 때
X와 Y가 이산확률변수일 때는 X와 Y에 대한 결합확률함수, 즉 결합확률질량함수를 바로 구할 수 있다.
또한, 두 변수에 대한 함수인 결합확률함수 (결합확률질량함수)를 이용해 주변확률질량함수 (marginal pmf)를 구할 수 있다.
즉, X와 Y에 대한 함수로 X에 대한 함수, Y에 대한 함수를 구할 수 있는 것이다.
<X와 Y가 이산확률변수일 때>
Joint pmf -> Marginal pmf
2. X와 Y가 연속확률변수일 때
X와 Y가 이산확률변수일 때는 X와 Y에 대한 누적분포함수를 통해 결합확률함수 (결합확률밀도함수)를 구할 수 있다.
또한, 두 변수에 대한 함수인 결합확률함수 (결합확률밀도함수)를 이용해 주변확률밀도함수 (marginal pdf)를 구할 수 있다.
구하는 과정을 표현하면 아래와 같다.
<X와 Y가 연속확률변수일 때>
Joint cdf -> Joint pdf -> Marginal pdf
이제 두 확률 변수에 대한 함수에 대해 자세히 알아보자.
연속확률변수에 관한 함수를 정의할 떄 누적분포확률을 먼저 정의한 이유는 cdf -> pmf 순서로 구해야 하기 때문이다.
두 확률변수에 대한 확률함수가 주어졌을 때 기댓값은 다음과 같다.
확률변수가 두개 주어졌을 때, 공분산과 상관계수를 구할 수 있다.
X와 Y의 상관계수(Correlation Coefficient)는 X와 Y가 얼마나 선형 관계를 가지고 있는지 보여주는 통계량이다.
결합분포확률과 공분산, 상관계수를 이용한 예제를 풀어보자.
'기초통계학 > 기초확률론' 카테고리의 다른 글
9. 확률생성함수(PGF, Probability Generating Functions) (0) | 2023.09.25 |
---|---|
8. 적률생성함수 (MGF, Moment Generating Function) (0) | 2023.09.11 |
6. 여러가지 연속확률분포 (Families of Continuous Distribution) (0) | 2022.11.27 |
5. 연속확률변수 (Continuous Random Variables) (0) | 2022.11.26 |
4. 여러가지 이산확률분포 (Families of Discrete Random Distribution) (0) | 2022.11.24 |
댓글