확률변수와 확률분포

Theoritical Statistics
Author

SEOYEON CHOI

Published

December 31, 2022

확률변수와 확률분포

확률

  • 표본공간; 모든 관찰 가능한 조합
  • 사건; 표본 공간의 부분 집합
  • 확률의 공리적 정의
    • \(P(S) = 1\), 사건이 일어날 확률은 1
    • \(0<P(A)<1\), 표본공간 안에서 사건 A의 확률은 0과 1 사이
    • \(A_1,A_2, \dots\)사건들 중 임의의 두 사건을 뽑았을 때, 공집합 이어야 함 \(\to\) 상호배반
      • \(P(A_i \cap A_j) = \varnothing\)
      • \(P(\sum A) = \sum P(A)\)

Example

  • 동전 3회 던지는 실험
    • \(S\{ (H,H), (H,T), (T,H), (T,T) \}\) \(\to\) 배반사건
      • \(P((H,H)) = \frac{1}{9}\)
      • \(P((H,T)) = \frac{2}{9}\)
      • \(P((T,H)) = \frac{2}{9}\)
      • \(P((T,T)) = \frac{4}{9}\)
    • \(P(S) = 1\)
    • \(P(\sum A_i) = \sum P(A_i)\)
  • 어떤 기계의 수명시간 측정

확률변수

확률변수 : 표본공간 S에 정의된 실수값을 가지는 합수(real-valued function), X 영문 대문자

  • 사건을 수치화, 실험 결과에 따라 변하는 변수
  • 사건의 가능성을 확률적으로 결정
  • 확률밀도함수 = 확률질량함수
  • \(P(X = x)\)라는 사건을 가징 확률 \(P(X=x)\)\(f(x)\)에 속해 있다.

이산형

  • \(f(1) = P(X = 1)\)

연속형

  • \(f(1)\) 이렇게 나타낼 수는 없지만, 넓이로 표현; 사건을 구간으로 표현

\(\star\) 확률변수는 대문자로, 관측값은 소문자로 표현

확률밀도함수 및 확률분포함수

확률밀도함수(probablity density function) - \(f(x)\)

확률분포함수(probablity distribution function) - \(F(x)\)

확률변수의 분포형태를 나타내는 데 사용

이산형 확률변수의 확률밀도함수

다음 조건 만족

  • 모든 실수 \(x\)애 대하여 \(f(x) \ge 0\)
  • 확률변수가 가질 수 있는 값 \(x_1, x_2, \dots\)에 대하여
    • \(f(x_i) > 0, \sum_{all x_i} f(x_i) = 1\)
  • 확률질량함수(probablity mass function)으로 부르기도 함
  • \(f(x) = P(X = x)\)

연속형 확률변수의 확률밀도함수

  • 셀 수 없이 무한히 많은 가능한 값 하나하나에 확률을 부여하지 않고 구간에 확률 부여, 즉 \(P(X=x)=0\)

다음 조건 만족

  • 모든 실수 \(x\)에 대하여 \(f(x) \ge 0\)
  • \(\int_{-\inf}^\inf f(x) dx = 1\)

\(P(a \le X \le b) = \int_a^b f(x) dx\)

\[P(X \in A) = \begin{cases} \sum_{x_i \in A} f(x_i) & \text{discrete } X \\ \int_A f(x) dx & \text{continuous } X \end{cases}\]

Example

구간 (0,3)에서 정의된 함수

  • \(f(x) = \frac{x^2}{9}\)
    • \(\frac{x^2}{9} \ge 0\)
    • \(\int_0^3 \frac{x^2}{9} dx = \frac{1}{9} \begin{bmatrix} \frac{x^2}{3} \end{bmatrix}^3_0 = 1\)

\(\therefore\) 확률밀도함수가 맞다.

(누적)분포함수(cumulative distribution function): 확률변수 \(X\)가 주어진 점 \(x\) 이하인 값을 가질 확률 \[F(x) = P(X \le x)\]

참고

  • \(X \sim f(x)\) : 확률변수 \(X\)가 확률밀도함수 \(f(x)\)를 가짐
  • \(X \sim F(x)\) : 확률변수 \(X\)가 확률분포함수 \(F(x)\)를 가짐

\[F(x) = \begin{cases} \sum_{x_i \le x} f(x_i) & \text{discrete } X \\ \int_{-\inf}^x f(t)dt & \text{continuous } X \end{cases}\]

확률뷴포함수의 성질

함수 \(F(x)\)가 어떤 확률변수 \(X\)의 누적분포함수가 되는 필요충분조건

  • \(lim_{x \to -\inf} F(x) = 0\)
  • \(lim_{x \to \inf} F(x) = 1\)
  • \(lim_{h \to 0+} F(x+h) = F(x)\)
  • \(a < b\)이면 \(F(a) \le F(b)\)

\[P(a < X \le b) = F(b) - F(a)\]

\(\star\) 연속형이라면? 각 점에서 확률이 0이니까

  • \(P(a \le X \le b) = P(a \le X < b) = P(a< X \le b) = P(a< X < b)\)

\(\star\) 이산형이라면?

  • probability density function 미분하면 step function 을 가지는 probability distribution function

Example

앞면 나올 확률이 \(\frac{1}{2}\)인 동전 3회 던지는 실험에서 관심있는 변수 \(X\) = 앞면의 수일때 \(f(x)\)\(F(x)\)는?

  • 각각 독립이다.
  • \(f(3) = P(X = 3) = P(A)P(B)P(C) = \frac{1}{2} \times \frac{1}{2} \times \frac{1}{2} = \frac{1}{8}\)
  • \(f(2) = P(X = 2) = P(A)P(B)P(C) = \frac{1}{8} \times 3\)
  • \(f(1) = P(X = 1) = P(A)P(B)P(C) = \frac{1}{8} \times 3\)
  • \(f(0) = P(X = 0) = P(A)P(B)P(C) = \frac{1}{2} \times \frac{1}{2} \times \frac{1}{2} = \frac{1}{8}\)
  • \(f(3) + f(2) + f(1) + f(0) = 1\)