Theoritical Statistics Final term 6 Explanation

Theoritical Statistics
박스뮬러변환
지수분포와 카이제곱
Author

GUEBIN CHOI

Published

March 3, 2023

Final term 질문

참고

using Distributions, Plots

6.

\(f(x) = \frac{1}{\theta} exp(-\frac{x}{\theta}) \to\) 평균이 \(\theta\)인 지수분포

\(H_0 : \theta = 2, H_1 : \theta = 1\)

검정통계량 \(T\)

T= x -> 0.5*exp(-0.5*x[1]) * 0.5*exp(-0.5*x[2])  / (exp(-x[1])*exp(-x[2]))
#1 (generic function with 1 method)

\(\alpha\) 구해보자. (시뮬레이션)

θ=2 
x = rand(Exponential(θ),2)
2-element Vector{Float64}:
 0.6687906085363371
 1.5350253919744037
T(x)
0.7524758613118447
Ts = [rand(Exponential(θ),2) |> T for i in 1:1400000]
mean(Ts .< 1/2)
0.15347

\(\beta\)를 구해보자.(시뮬레이션)

θ=1
x = rand(Exponential(θ),2)
2-element Vector{Float64}:
 3.8233540141024713
 1.6552057743570938
Ts = [rand(Exponential(θ),2) |> T for i in 1:1400000]
mean(Ts .> 1/2)
0.5970164285714286

\(\alpha\)를 구해보자. (이론)

\(T(X_1,X_2) = \frac{0.25 exp(-0.5 X_1 - 0.5 X_2)}{exp(-X_1 - X_2)} = 0.25 exp(0.5 X_1 + 0.5 X_2)\)

\(T(X_1,X_2) < \frac{1}{2} \iff exp(0.5 X_1 + 0.5 X_2) < 2 \iff X_1 + X_2 < 2 ln2\)

그런데 \(X_1 + X_2 \sim \chi^2(4)\) under \(H_0\)

\(P(X_1 + X_2 < 2 ln 2) = \int^{2ln2}_{0} \frac{1}{4 \Gamma(2)} x e^{-x/2} dx = \int^{ln2}_{0} t e^{-t} dt = [ t(-e^{-t}) -e^{-t}]^{ln 2}_{0}\)

t = log(2) 
u = t*(-exp(-t)) - exp(-t)
t = 0
l = t*(-exp(-t)) - exp(-t)
-1.0
u-l
0.1534264097200273

\(\beta\)를 구해보자. (이론)

\(T(X_1,X_2) > \frac{1}{2} \iff exp(0.5 X_1 + 0.5 X_2) < 2 \iff 2(X_1 + X_2) < 4 ln2\)

그런데 \(2(X_1 + X_2) \sim \chi^2(4)\) under \(H_0\)

\(P(2(X_1 + X_2) < 4 ln 2) = \int_{4ln2}^{\infty} \frac{1}{4 \Gamma(2)} x e^{-x/2} dx = \int_{2ln2}^{\infty} t e^{-t} dt = [ t(-e^{-t}) -e^{-t}]_{2ln 2}^{0}\)

u = 0
t = 2*log(2)
l = t*(-exp(-t)) - exp(-t)
-0.5965735902799727
u-l
0.5965735902799727

박스뮬러변환

\(\begin{cases} \frac{R^2}{2} \sim Exp(1) \\ \Theta \sim U(0,2\pi) \end{cases} \to \begin{bmatrix} R \cos\Theta \\ R \sin \Theta \end{bmatrix} \to N\Big( \begin{bmatrix} 0\\0 \end{bmatrix} \begin{bmatrix} 1 &0 \\ 0 & 1 \end{bmatrix} \Big)\)

위에서 \(R^2\)은 반지름의 제곱

  • 지수분포 \(\times\) 2는 평균이 2배가 되는 지수분포가 된다.(스케일링 가능)

따라서 \(R^2\)\(X_1^2 + X_2^2\)랑 분포가 같다.

  • 여기에서 \(X_1, X_2 \sim N(0,1)\) 각각 표준정규분포를 따른다.
  • 표준정규분포를 각각 제곱해서 더하면 \(\chi^2\)을 따른다.
  1. \(Exp(2) \sim \chi^2(2)\)

  2. \(Exp(2) + Exp(2) \sim \chi^2(4)\)

  3. \(Exp(2) + Exp(2)+ Exp(2) \sim \chi^2(6)\)

  4. \(\dots\)

  5. \(\sum^n Exp(2) \sim Gamma(n,2)\)

    • 책에 따라 \(Gamma(n,2)\) 혹은 \(Gamma(n,\frac{1}{2}\) 혹은 \(Gamma\frac{1}{2},1)\) 쓰기도 한다.