확률변수와 확률분포
확률
- 표본공간; 모든 관찰 가능한 조합
- 사건; 표본 공간의 부분 집합
- 확률의 공리적 정의
- \(P(S) = 1\), 사건이 일어날 확률은 1
- \(0<P(A)<1\), 표본공간 안에서 사건 A의 확률은 0과 1 사이
- \(A_1,A_2, \dots\)사건들 중 임의의 두 사건을 뽑았을 때, 공집합 이어야 함 \(\to\) 상호배반
- \(P(A_i \cap A_j) = \varnothing\)
- \(P(\sum A) = \sum P(A)\)
Example
- 동전 3회 던지는 실험
- \(S\{ (H,H), (H,T), (T,H), (T,T) \}\) \(\to\) 배반사건
- \(P((H,H)) = \frac{1}{9}\)
- \(P((H,T)) = \frac{2}{9}\)
- \(P((T,H)) = \frac{2}{9}\)
- \(P((T,T)) = \frac{4}{9}\)
- \(P(S) = 1\)
- \(P(\sum A_i) = \sum P(A_i)\)
- \(S\{ (H,H), (H,T), (T,H), (T,T) \}\) \(\to\) 배반사건
- 어떤 기계의 수명시간 측정
확률변수
확률변수 : 표본공간 S에 정의된 실수값을 가지는 합수(real-valued function), X 영문 대문자
- 사건을 수치화, 실험 결과에 따라 변하는 변수
- 사건의 가능성을 확률적으로 결정
- 확률밀도함수 = 확률질량함수
- \(P(X = x)\)라는 사건을 가징 확률 \(P(X=x)\)는 \(f(x)\)에 속해 있다.
이산형
- \(f(1) = P(X = 1)\)
연속형
- \(f(1)\) 이렇게 나타낼 수는 없지만, 넓이로 표현; 사건을 구간으로 표현
\(\star\) 확률변수는 대문자로, 관측값은 소문자로 표현
확률밀도함수 및 확률분포함수
확률밀도함수(probablity density function) - \(f(x)\)
확률분포함수(probablity distribution function) - \(F(x)\)
확률변수의 분포형태를 나타내는 데 사용
이산형 확률변수의 확률밀도함수
다음 조건 만족
- 모든 실수 \(x\)애 대하여 \(f(x) \ge 0\)
- 확률변수가 가질 수 있는 값 \(x_1, x_2, \dots\)에 대하여
- \(f(x_i) > 0, \sum_{all x_i} f(x_i) = 1\)
- 확률질량함수(probablity mass function)으로 부르기도 함
- \(f(x) = P(X = x)\)
연속형 확률변수의 확률밀도함수
- 셀 수 없이 무한히 많은 가능한 값 하나하나에 확률을 부여하지 않고 구간에 확률 부여, 즉 \(P(X=x)=0\)
다음 조건 만족
- 모든 실수 \(x\)에 대하여 \(f(x) \ge 0\)
- \(\int_{-\inf}^\inf f(x) dx = 1\)
\(P(a \le X \le b) = \int_a^b f(x) dx\)
\[P(X \in A) = \begin{cases} \sum_{x_i \in A} f(x_i) & \text{discrete } X \\ \int_A f(x) dx & \text{continuous } X \end{cases}\]
Example
구간 (0,3)에서 정의된 함수
- \(f(x) = \frac{x^2}{9}\)
- \(\frac{x^2}{9} \ge 0\)
- \(\int_0^3 \frac{x^2}{9} dx = \frac{1}{9} \begin{bmatrix} \frac{x^2}{3} \end{bmatrix}^3_0 = 1\)
\(\therefore\) 확률밀도함수가 맞다.
(누적)분포함수(cumulative distribution function): 확률변수 \(X\)가 주어진 점 \(x\) 이하인 값을 가질 확률 \[F(x) = P(X \le x)\]
참고
- \(X \sim f(x)\) : 확률변수 \(X\)가 확률밀도함수 \(f(x)\)를 가짐
- \(X \sim F(x)\) : 확률변수 \(X\)가 확률분포함수 \(F(x)\)를 가짐
\[F(x) = \begin{cases} \sum_{x_i \le x} f(x_i) & \text{discrete } X \\ \int_{-\inf}^x f(t)dt & \text{continuous } X \end{cases}\]
확률뷴포함수의 성질
함수 \(F(x)\)가 어떤 확률변수 \(X\)의 누적분포함수가 되는 필요충분조건
- \(lim_{x \to -\inf} F(x) = 0\)
- \(lim_{x \to \inf} F(x) = 1\)
- \(lim_{h \to 0+} F(x+h) = F(x)\)
- \(a < b\)이면 \(F(a) \le F(b)\)
\[P(a < X \le b) = F(b) - F(a)\]
\(\star\) 연속형이라면? 각 점에서 확률이 0이니까
- \(P(a \le X \le b) = P(a \le X < b) = P(a< X \le b) = P(a< X < b)\)
\(\star\) 이산형이라면?
- probability density function 미분하면 step function 을 가지는 probability distribution function
Example
앞면 나올 확률이 \(\frac{1}{2}\)인 동전 3회 던지는 실험에서 관심있는 변수 \(X\) = 앞면의 수일때 \(f(x)\)와 \(F(x)\)는?
- 각각 독립이다.
- \(f(3) = P(X = 3) = P(A)P(B)P(C) = \frac{1}{2} \times \frac{1}{2} \times \frac{1}{2} = \frac{1}{8}\)
- \(f(2) = P(X = 2) = P(A)P(B)P(C) = \frac{1}{8} \times 3\)
- \(f(1) = P(X = 1) = P(A)P(B)P(C) = \frac{1}{8} \times 3\)
- \(f(0) = P(X = 0) = P(A)P(B)P(C) = \frac{1}{2} \times \frac{1}{2} \times \frac{1}{2} = \frac{1}{8}\)
- \(f(3) + f(2) + f(1) + f(0) = 1\)