본문 바로가기
728x90

확률8

2. 도표와 그래프 (Chart and Graph) 자료를 시각적으로 정리하고 요약하자. 1. 도수분포표(frequency table)와 히스토그램(histogram) 관측값의 범위를 적당한 계급 구간으로 나누어 작성하는 표와 그래프이다. 계급 구간은 5~20개로 나누어 그려지며 계급 구간의 크기는 모두 동일하다. 히스토그램은 도수분포표를 바탕으로 그려지고, 컴퓨터 프로그램(엑셀, R 등)을 이용해 그린다면 도수분포표를 작성하지 않고 히스토그램을 바로 그릴 수 있다. 자료가 두 계급에 동시에 속하는 것을 막으려면? 자료가 소수점 n자리수까지 표현되어 있을 때 계급은 소수점 (n+1)자리수로 나누는 것이 좋다. 2. 줄기-잎 그림 (stem and leaf diagram) 각 자료를 줄기와 잎 두 분으로 분할하여 자료의 줄기 부분을 세로로 나열하고, 각 줄.. 2022. 12. 15.
7. 결합확률분포와 주변확률분포 (Joint Probability Function & Marginal Probability Function) 확률변수가 두 개일 때의 분포와 결합누적분포함수 (joint cdf)를 알아보자. (cdf를 먼저 정의하는 이유는 연속확률분포일 때 cdf -> pdf 순서로 구하기 때문이다.) 1. X와 Y가 이산확률변수일 때 X와 Y가 이산확률변수일 때는 X와 Y에 대한 결합확률함수, 즉 결합확률질량함수를 바로 구할 수 있다. 또한, 두 변수에 대한 함수인 결합확률함수 (결합확률질량함수)를 이용해 주변확률질량함수 (marginal pmf)를 구할 수 있다. 즉, X와 Y에 대한 함수로 X에 대한 함수, Y에 대한 함수를 구할 수 있는 것이다. 더보기 Joint pmf -> Marginal pmf 2. X와 Y가 연속확률변수일 때 X와 Y가 이산확률변수일 때는 X와 Y에 대한 누적분포함수를 통해 결합확률함수 (결합확률.. 2022. 12. 8.
6. 여러가지 연속확률분포 (Families of Continuous Distribution) 지난 글에서는 연속확률변수의 정의와 성질에 대해 알아보았다. 이번에는 다양한 연속확률분포의 종류에 대해 알아보자. 1. 균일 분포 (Uniform Random Distribution) 이산확률분포에서도 균일분포가 등장했었지만, 둘은 변수의 형태가 다르기 때문에 확률함수, 평균, 분산이 조금씩 다르다. 균일 분포의 평균과 분산에 대한 증명은 다음과 같다. 2. 지수 분포 (Exponential Distribution) 지수 분포는 사건이 지속되는 시간(다음 사건이 일어날 때까지의 시간 간격)에 관한 분포이다. 모수는 단이 시간당 사건의 평균 발생 횟수이고, 확률함수를 쓸 때는 역수를 취해주면 된다. (문제 자체에 역수가 취해져서 나오는 경우도 있다.) 지수 분포의 평균과 분산에 대한 증명은 다음과 같다. .. 2022. 11. 27.
5. 연속확률변수 (Continuous Random Variables) 확률변수의 종류는 "확률변수값을 셀 수 있는가?"에 따라 이산확률변수, 연속확률변수 두 가지로 나뉜다. 이번 포스팅에서는 연속확률변수에 대해 설명할 예정이다. 연속확률변수에 대해서는 누적분포함수(CDF)를 먼저 배우는 것이 편하다. 왜냐하면 연속확률변수에서는 한 점에서의 확률 P(X=x)을 구할 수 없어 확률함수보다는 누적함수를 사용하는 것이 편리하기 때문이다. 즉, 이산확률변수에서는 확률질량함수(PMF) -> 누적분포함수(CDF) 순으로, 연속확률변수에서는 누적분포함수(CDF) 미분 -> 확률밀도함수(PMF) 순으로 구하는 것이 편하다. 전공책에도 위와 같은 문제들이 많다. 연속확률변수의 확률함수는 확률밀도함수(PDF)라고 부른다. cf.) 이산확률변수의 확률함수는 확률질량함수(PMF)라고 부른다. 주.. 2022. 11. 26.
4. 여러가지 이산확률분포 (Families of Discrete Random Distribution) 지난 글에서는 이산확률변수의 정의와 성질에 대해 알아보았다. 이번에는 다양한 이산확률분포의 종류에 대해 알아보자. 1. 베르누이 분포 (Bernoulli Random Distribution) 베르누이 분포의 평균과 분산에 대한 증명은 다음과 같다. 2. 이항분포 (Binomial Random Distribution) 이항분포의 평균과 분산에 대한 증명은 다음과 같다. 3. 기하분포 (Geometric Distribution) 기하분포의 평균과 분산에 대한 증명은 다음과 같다. 기하분포는 무기억 성질을 가지고 있는 이산확률변수이다. 무기억 성질에 대한 이야기는 사전에서 자세히 읽는 것을 추천한다. https://terms.naver.com/entry.naver?docId=4125283&cid=60207&c.. 2022. 11. 24.
3. 이산확률변수 (Discrete Random Variables) 확률 변수란 표본공간 S 위의 확률을 실수 위의 확률로 대응시켜주는 함수를 의미한다. 표본공간은 X의 가능한 모든 값들의 집합을 의미한다. 수학적 정의만 접했을 때는 이해가 잘 가지 않을 수 있으므로, 파란색 글씨로 쓴 예를 함께 보는 것이 좋다. 확률변수의 종류는 이산확률변수, 연속확률변수 두 가지로 나뉜다. 이산확률변수는 확률 변수가 가질 수 있는 값이 이산값인 확률변수를 의미한다. 주의!) 이산확률변수와 연속확률변수를 구분하는 방법은 "확률변수값이 유한한가?"를 따지는 것이 아니라 아니라 "확률변수값을 셀 수 있는가?"를 따지는 것이다. (유한성을 따지는 것이 아니라 가산 여부를 따지는 것) 이산확률변수의 예시로는 직원 100명 중 결근하는 직원의 수, 가정의 자녀 중 딸인 자녀의 수, 동전을 던질.. 2022. 11. 18.
2. 시행과 확률(Experiments, Models, and Probabilities) - 2 전체 확률의 법칙의 개념과 유사한 개념을 사용한 "베이즈 정리(Bayes' Therom)"에 대해 알아보자. 정의는 아래와 같으며, 의의를 알아두는 것이 중요하다. 베이즈 정리는 "어떤 사건이 일어날 때 그 원인이 B에 있을 확률"를 구하게 해주는 법칙이다. 독립(Independence)의 정의는 아래와 같다. 독립을 결정할 때는 꼭 정의에 기반한 계산을 거쳐야만 하며, 사건의 배반과 헷갈려서는 안된다. 배반(Mutual Exclusiveness)은 사건의 교집합이 공집합인 경우로, 집합의 체계에서 쓰이는 개념이다. 독립은 확률 간의 관계를 정의할 때 쓰이는 개념이므로 둘은 다르다. 독립에는 두 가지 종류가 있다. 짝으로(쌍별) 독립 (pairwise independent)은 두 확률이 독립일 때, 상호.. 2022. 11. 12.
1. 시행과 확률(Experiments, Models, and Probabilities) - 1 기초확률론은 확률에 대한 수학적 성질들을 배우는 과목이다. chapter1과 chapter2는 거의 대부분 통계학1에서 배운 내용으로 이루어진다. 뒷부분에는 다변수적분이 등장하므로 미분적분학을 배우고 오는 것이 권장된다 (앞부분은 기초 지식이 없어도 괜찮다!) 책은 Probability and Stochastic Processes A Friendly Introduction for Electrical and Computer Engineers (Roy D. Yates and David J. Goodman)을 참고했다. 확률에 대해 이야기하기 전에, 먼저 집합에 대해 알아보자. 집합의 개념으로 확률을 설명하고, 집합의 체계는 일반 대수학과 다르다. 집합론의 용어 (표본 공간, 사건, 결과)에 대해 잘 알아두자.. 2022. 9. 28.
728x90