728x90 기초통계학43 1. 기술 통계량 (Descriptive Statistic) 통계분석 분야는 두 가지로 나눠진다. 하나는 자료의 특징을 기술(descript)하는 기술통계(descriptive statistic)이고, 또 다른 하나는 표본 집단의 자료로부터 모집단의 특성을 추정 및 검정하는 통계추론(statistical inferences)이다. 자료기술을 하는 방법은 크게 두가지로 나뉘는데, 그래프를 이용하는 기법과 수치화된 기술통계량을 사용하는 기법이다. 이번 시간에는 수치화된 기술통계량에 대해 알아보자. 가장 먼저, 자료의 중심에 관한 측도에는 평균, 최빈값, 중앙값이 있다. 평균과 중앙값은 자주 쓰는 통계량이다. 절단 평균, 윈저화 평균같은 로버스트 통계량은 극단적인 값들의 영향을 줄인 평균이다. 평균값, 최빈값, 중앙값의 활용 예시 "최빈값은 흔히 인기도의 측도로서 사용.. 2022. 10. 9. 2. 최소제곱법 (Least Square Method) 1단원에서는 회귀 분석의 정의와 회귀 식의 수학적 특징에 대해 알아보았다. 특히 다양한 회귀 모형 중 선형 단순 회귀 모형에 대해 자세히 알아보았었는데, 2단원에서는 자료를 잘 표현할 수 있는 선형 단순 회귀식을 세우는 방법에 대해 알아보도록 하자. 최소제곱법 (최소자승법)이란, 우리가 구하고자 하는 식 y=β0+β1x+ε 에서 회귀 계수인 β0 β1을 구하는 방법 중 하나이다. 모든 자료들을 좌표 위 점으로 생각하자. (산점도) 두 점을 이으면 직선이 되기 때문에, 랜덤하게 점 두 개를 선택한 후 두 점을 이어서 그릴 수 있는 직선의 개수는 매우 많을 것이다. 이 점들을 이은 직선 중 실제 값과 직선 위에서 예측한 값과의 오차가 가장 적은 직선을 찾는 방법이 최소제곱법이다. 실제로 최소제곱법을 이용해 .. 2022. 10. 4. 1. 선형 단순 회귀 모형 (Linear Simple Regression Model) 회귀 분석이란, 여러가지 변수 간의 관계성을 알아보는 통계학의 방법론이다. 즉, 변수 간 관계가 있는가? 음의 상관관계와 양의 상관관계 중 어떤 상관관계를 갖는가? 만을 분석할 수 있는 상관 분석 (Correlation analysis)과 달리 변수 간의 관계를 나타낼 수 있는 식을 세우고, 이를 바탕으로 값을 예측까지 할 수 있는 통계 분석, 추론 방법이다. 우리가 관심이 있는 변수를 Y로 두고, 변수 Y를 예측하는데 도움을 주는 변수를 x라 하자. Y를 반응 변수 (response variable) 혹은 종속 변수 (dependent variable)로 부르고, x를 예측 변수 (predictor variable), 혹은 독립 변수 (independent variable) 혹은 설명 변수 (expla.. 2022. 10. 2. 1. 시행과 확률(Experiments, Models, and Probabilities) - 1 기초확률론은 확률에 대한 수학적 성질들을 배우는 과목이다. chapter1과 chapter2는 거의 대부분 통계학1에서 배운 내용으로 이루어진다. 뒷부분에는 다변수적분이 등장하므로 미분적분학을 배우고 오는 것이 권장된다 (앞부분은 기초 지식이 없어도 괜찮다!) 책은 Probability and Stochastic Processes A Friendly Introduction for Electrical and Computer Engineers (Roy D. Yates and David J. Goodman)을 참고했다. 확률에 대해 이야기하기 전에, 먼저 집합에 대해 알아보자. 집합의 개념으로 확률을 설명하고, 집합의 체계는 일반 대수학과 다르다. 집합론의 용어 (표본 공간, 사건, 결과)에 대해 잘 알아두자.. 2022. 9. 28. 15. 벡터 공간 (Vector Space) 이번 시간에는 벡터 공간에 대해 알아보자. (공간 벡터와는 완전히 다른 개념이니 혼동하지 말자!!) 벡터 공간이란 덧셈과 스칼라곱의 연산을 정의할 수 있으며 그에 대한 특정 조건을 만족하는 집합(공간)을 의미한다. 특정 조건(벡터 공간의 공리) 에는 8가지가 있다. 즉, 벡터 공간은 1. 덧셈의 연산을 정의할 수 있고 2. 스칼라곱의 연산을 정의할 수 있고 3. 특정한 조건(공리) 8가지를 만족 하는 집합이다. 우리가 평소에 계산하던 숫자, 함수, 벡터, 행렬 등이 이 벡터공간에 속해있고, 우리는 이미 이 벡터 공간 속에서 많은 계산을 해왔다. 오히려 너무 당연하게 여기던 개념을 체계화해서 어렵게 느껴질 수도 있다. 아래 동영상도 벡터 공간을 이해하는데 큰 도움이 된다. (역시 동영상 굿굿,,) http.. 2022. 5. 30. 14. 벡터의 내적 (Inner Product of Vectors) 이번 시간에는 벡터의 내적에 대해 알아보자. 벡터의 내적은 벡터끼리 곱해 스칼라 값이 결과로 나오게 하는 계산이다. 벡터의 내적은 주로 아래의 두가지 식을 사용해 값을 구한다. 1. u∙v=|u||v|cosθ 2. u∙v=u1v1+u2v2+u3v3 내적의 결괏값은 항상 스칼라값으로 표현된다는 점을 주의하자. 내적의 값을 구하는 공식인 u∙v=|u||v|cosθ를 제2코사인법칙을 이용해 증명해보자. 내적은 벡터 사이의 각을 구할 때 매우 유용하다. 벡터의 내적을 이용해 두 백터의 사잇각을 구하는 예제를 풀어보자. 벡터의 내적이 어떻게 과학이나 공학에서 활용되는지 와닿지 않을 수 있다. 직관적이면서도 간단한 벡터의 내적 활용 예시로는 가중치 평균이 있다. 이번에는 내적을 이용해 벡터의 상대적 유사성을 측정해.. 2022. 5. 28. 13. 벡터 (Vector) 기초 2022. 5. 28. 12. 가우스 소거법을 이용한 역행렬의 계산 (Calculation of Inverse Matrix Using Gaussian Elimination) 앞에서 배웠던 가우스 소거법을 이용해 역행렬을 계산하는 과정을 알아보자. 행렬 A의 역행렬을 계산하기 위해서는 좌측에 A, 우측에 항등행렬을 써서 하나의 행렬로 취급한 후 가우스 소거법을 사용하면 된다. 가우스 소거법을 사용해 역행렬을 구하는 예제를 풀어보자. 이를 통해 역행렬을 구하는 방법 세가지를 배우게 되었다. (역행렬은 nxn행렬일 때, 행렬식의 값이 0이 아닐 때 존재) 1. 1x1 행렬, 2x2 행렬 -> 공식 이용 (기억이 안 난다면 -> https://portrait-of-youngblood.tistory.com/8) 2. 모든 nxn 행렬 -> A의 수반행렬/A의 행렬식 (기억이 안 난다면 -> https://portrait-of-youngblood.tistory.com/13) 3. 모든.. 2022. 5. 28. 이전 1 2 3 4 5 6 다음 728x90