본문 바로가기
728x90

기초통계학/기초통계학12

12. 우도와 최대우도추정 (Likelihood and Maximum Likelihood Estimation) 오늘은 통계학에서 자주 등장하는 개념인 가능도(likelihood)에 대해 알아보자. 가능도는 우도라고 부르기도 하는데 개인적으로는 가능도라는 말이 더 와닿는 것 같다. 가능도의 정의는 책마다 다르고, 네이버 사전에서는 다음과 같이 정의한다. 우도는 나타난 결과에 따라 여러 가능한 가설들을 평가할 수 있는 측도이며, 각 가설을 지지하는 정도로 볼 수 있다. 우도의 개념은 확률(probability)과 구분할 필요가 있다. 확률은 관측값 또는 관측 구간이 주어진 확률분포 안에서 얼마만큼 나타날 수 있는가에 대한 값이다. 그런데 우도는 이와 달리 어떤 특정한 값을 관측할 때, 이 관측치가 어떠한 확률분포에서 나왔는가에 관한 값이다. 다시 말하면, 모수로부터 특정 현상이 관찰되는 것을 확률의 문제라고 한다면,.. 2023. 9. 26.
11. 단순선형회귀와 최소제곱법 (Simple Linear Regression and Least Square Method) https://portrait-of-youngblood.tistory.com/36 1. 선형 단순 회귀 모형 (Linear Simple Regression Model) 회귀 분석이란, 여러가지 변수 간의 관계성을 알아보는 통계학의 방법론이다. 즉, 변수 간 관계가 있는가? 음의 상관관계와 양의 상관관계 중 어떤 상관관계를 갖는가? 만을 분석할 수 있는 상관 portrait-of-youngblood.tistory.com https://portrait-of-youngblood.tistory.com/37 2. 최소제곱법 (Least Square Method) 1단원에서는 회귀 분석의 정의와 회귀 식의 수학적 특징에 대해 알아보았다. 특히 다양한 회귀 모형 중 선형 단순 회귀 모형에 대해 자세히 알아보았었는데,.. 2023. 6. 12.
10. 카이제곱 검정 (Chi-squared Test) 카이제곱분포를 이용해 세 가지의 카이제곱 검정을 할 수 있다. 첫밴째는 적합도 검정(Goodness of fit test), 두번째는 독립성 검정 (indepedence test), 세번째는 정규성 검정 (normality test)이다. 1. 적합도 검정 (Goodness of fit test) 적합도 검정을 이해하기 위해 다항시행 (multinomial experiment)를 먼저 알아야 한다. 여러가지 이산분포에서 배웠었던 이항분포를 확장한 것이라고 생각하면 된다. 예측관측수와 실제관측빈도수를 이용해 검정통계량을 구하고, 이전에 사용했던 방법을 이용해 가설검정을 진행하면 된다. 여기서 주의할 것은, H1에 "≠"가 포함되어 있더라도 항상 우측검정을 진행해야 한다는 것이다. 2. 독립성 검정 (Ind.. 2022. 12. 16.
9. 분산 분석 (ANOVA - Analysis of variance) 2022. 12. 16.
8. 두 모집단에 관한 가설검정 (Hypothesis Test about Two Populations) 이번 단원에서는 두 집단의 모평균, 모분산, 모비율을 검정한다. 먼저 두 집단의 모평균 간 차이에 대한 추론은 다음과 같다. 가설검정을 하는 방법은 이전에 했던 방법과 같으며, 모분산을 알 때와 모분산을 모를 때로 나누어 구하는 것도 동일하다. 모집단이 한 개일 때와 마찬가지로 모분산을 알 때는 정규분포, 모분산을 모를 때는 t 분포를 사용한다. 모집단이 한 개일 때는 모분산에 대한 추론, 검정을 하고자 할 때 카이제곱분포를 이용하지만 모집단이 두 개일 때는 두 카이제곱 확률변수의 비로 정의된 F 분포를 사용한다. 모분산에 대한 가설검정의 예제를 풀어보자. 모비율에 대한 추론 또한 모집단이 한 개일 때와 같은 방법을 사용한다. 모비율에 대한 가설 검정 예제를 풀어보자. 2022. 12. 15.
7. 모집단에 관한 가설검정 (Hypothesis Test about a Population) 5장에서는 모분산을 아는 상태에서 가설검정을 진행했지만, 실제로는 모분산을 모르는 경우가 훨씬 많다. 이러한 경우에는 z분포가 아닌 t분포를 바탕으로 검정해야 한다. 가설검정의 방법은 같으므로 검정통계량(test statistic)을 구하거나 임계값(critical value)를 구할 때만 t 분포라는 것을 인지하고 검정하면 된다. 모분산을 모르는 상황에서 모평균에 관한 가설 검정을 해보자. 모분산을 모르는 상황이므로 t 분포를 사용해야 한다. 모평균에 관한 추론과 다르게, 모분산에 대한 추론, 가설검정을 할 때는 카이제곱분포(Chi-squared distribution)을 사용해야 한다.모분산에 대한 가설 검정 또한 z분포나 t분포를 사용할 때와 같은 방법을 사용한다. 모분산의 가설검정과 관련된 예제를.. 2022. 12. 15.
6. 가설 검정의 개념 (Concept of Hypothesis Test) 통계학에서 가설 검정이란 표본에 포함된 정보를 토대로 모수에 대한 가설의 옳고 그름을 판정하는 절차이다. 가설검정에 사용되는 기본 개념들은 다음과 같다. 기존에 인정한 가설을 "귀무가설", 새롭게 증명하고 싶은 가설을 "대립가설"이라고 한다. 하지만 가설 검정 또한 통계적 추론 방법 중 하나이기 때문에 오류가 일어날 수 있다. 두 종류의 오류가 발행하는데, 경우에 따라 제1종 오류와 제2종 오류로 구분한다. 가설검정에서 흔히 사용하는 유의수준 알파값은 제1종 오류가 일어날 확률을 의미한다. 방향에 따라 검정을 두가지 종류로 나눌 수 있다. 대립가설 (H1, alternative hypothesis)에 "≠"가 포함되어 있다면 양측 검정, ""가 포함되어 있다면 단측 검정이다. 이제 가설 검정을 직접 해보.. 2022. 12. 15.
5. 표본추출과 확률분포 - 2 모집단 (population): 통계적 관찰의 대상이 되는 전체 집단 표본 (sample): 통계 조사를 위해 선택된 모집단의 일부. 표본의 크기는 비용, 시간 등을 고려한 표본추출계획에 따라 결정된다. 랜덤 표본 (random sample): 분포 f(x)를 갖는 모집단으로부터 추출된 표본으로, 각각의 확률 변수는 분포 f(x)를 따르고 서로 독립이다. 모수 (parameter): 모집단의 특성 값으로 미지의 상수(unknown constant)이며, 확률분포의 형태를 결정하는 값으로서 통계적 추론의 대상이다. 통계량 (statistic): 랜덤 표본에 속한 관측값들의 함수를 통계량이라 한다. 확률 변수이며, 각각의 관측이 분포를 가지고 있으므로 관측들의 함수인 통계량도 자신의 분포를 갖는다. (대부분.. 2022. 12. 15.
728x90