Theoritical Statistics Final term

Theoritical Statistics
Author

SEOYEON CHOI

Published

January 26, 2023

Final term

1.

모수 θ에 대한 서로 독립인 비편향 추정량 θ^1θ^2이 존재하며 Var(θ^i)=σi2,i=1,2이라고 한다. 이를 이용하여 새로운 추정량 θ^a1,a2=a1θ^1+a2θ^2를 정의할 때 다음에 답하시오.

(a)

θ^a1,a2이 비편향추정량이 될 a1a2의 조건을 구하시오

answer

비편향 추정량 θ1, θ2, E(θ^1)=θ¯, E(θ^2)=θ¯

E(θ^a1,a2)=E(a1θ^1+a2θ^2)=a1E(θ^1)+a2E(θ^2)=a1θ¯+a2θ¯=θ¯(a1+a2)

θ¯=θ¯(a1+a2), 즉, a1+a2=1

(b)

비편향추정량인 θ^a1,a2 중에서 가장 작은 분산을 가지는 추정량을 구하시오.

answer

Var(θ^1)=σ12, Var(θ^2)=σ22

Var(θ^a1,a2)=Var((a1+a2)θ¯)=(a1+a2)2Var(θ^)

(a1+a2)2이 최소이면서 a1+a2=1일 때, 즉 a1=0.5,a2=0.5일 때 가장 작은 분산을 가진다.

2.

X1,X2,,XnBer(p)로부터의 랜덤표본이라고 하자. 모집단의 분포 Ber(p)의 분산인 p(1p)을 추정하고자 한다.

(a)

p(1p)에 대한 비편향추정량의 크래머-라오 하한값을 구하시오.

answer

bias = E(p^(1p^))p(1p)=0

E(X¯)=np, Var(X¯)=np(1p)

E(p^(1p^))=E(X¯n(1X¯n))=E(X¯n(X¯n)2)=pp2

f(x)=px(1p)1x

logf(x)=xlogp+(1x)log(1p)

logf(x)p=xp1x1p

2logf(x)2p=xp21x(1p)2

I(θ)=E[(θlogf(C;θ))2)]

I(p)=E(xp21x(1p)2)=1p+11p=1p(1p)

CRLB=g(p)2nI(p)=(12p)2p(1p)n

g(p)=p(1p), g(p)=12p

(b)

X1(1X2)의 기댓값을 구하시오.

answer

E(X1(1X2))=E(X1X1X2)=E(X1)E(X1X2)=E(X1)E(X1)E(X2)=pp2=p(1p)

(c)

p(1p)에 대한 최소분산 비편향 추정량을 구하시오.

answer

E(X¯n(1X¯n))=(n1)p(1p)n

p(1p)=nX¯n(1X¯n)n1

(d)

p(1p)에 대한 적률추정량을 구하시오.

answer

M1=E(X¯)=p

M2=Var(X¯)+E(X¯)2=p(1p)+p2=p

p(1p)의 적률추정량 (p(1p))MME=M2M12=pp2=p(1p)

(e)

p(1p)에 대한 최대가능도추정량을 구하시오.

answer

f(x)=px(1p)1x,x=0,1,0<p<1

L(p)=f(x1|p)f(xn|p)=px1(1p)1x1pxn(1p)1xn=pxi(1p)nxi

l(p)=xilogp+(nxi)log(1p)

l(p)=xipnxi1p=0

p^=xin=X¯

(p^(1p^))MLE=X¯(1X¯)

3.

다음 분포를 따르는

f(x;θ)=θexp(θx)I(x>0)

모집단으로부터의 랜덤표본 X1,,Xn을 이용하여 θ에 대한 신뢰구간을 구하고, 다음 가설

H0:θ=2 vs H1:θ2

을 검정하고자 한다. 다음에 답하시오.

교수님 review

(a)

θ에 대한 적절한 추축변량을 구하고, 해당 추축변량의 분포를 명시하시오.

answer

Xiexp(1θ)

2Xiθexp(2)

2nX¯θχ2(2n)

참고

(b)

θ에 대한 95%신뢰구간을 구하시오.

answer

(χ0.0252(2n)2nX¯θχ0.9752(2n))=0.95

θ0.95(χ0.0252(2n)2nX¯,χ0.9752(2n)2nX¯)

(c)

P(X>1)에 대한 95% 신뢰구간을 구하시오.

answer

P(X>1)=1θexθdx=[exθ]1=eθ

P(X>1) 95% CI : (exp(χ0.97552(2n)2nX¯,exp(χ0.0252(2n)2nX¯))

(d)

가설에서 고려하고 있는 θ의 전체 모수공간 Ω와 귀무가설 하에서의 모수공간 Ω0을 구하시오.

answer

Ω={θ:θ>0}

Ω0={θ:θ=2}

(e)

θ의 가능도 함수를 기술하시오.

answer

L(θ)=θneθnX¯

(f)

θΩ에서의 최대가능도 추정량과 Ω0에서의 최대가능도 추정량을 구하시오.

answer

θ^Ω=1X¯

θ^Ω0=2

(g)

일반화 가능도 비 Λ을 구하시오.

answer

L(θ^Ω0)L(θ^Ω)=θ^n,Ω0eθ^nX¯θ^n,Ωeθ^nX¯=(2n)2enx¯(θ2)

(h)

유의수준 α인 가능도비 검정법의 기각역을 χ2분포의 분위수를 사용하여 표현하시오.

answer

7장 예제 7.2.3. 참고

2(l(θ^Ω)l(θ^Ω0))=2n(x¯θ01log(X¯θ0))

최대가능도비 검정의 기각역 형태 2n(x¯θ01log(X¯θ0))c

기각역

{x¯θ0c1 또는 x¯θ0c2c1logc1=c2logc2

4.

확률밀도한수가

f(x;θ)=1θI(0xθ)

인 분포로부터 하나의 관찰값 X를 얻었다. 이 때 가설

H0:θ=1 vs H1:θ=2

에 대한 기각역을 C={x:x>0.8}로 했을 때 제1종오류를 범할 확률과 검정력을 계산하시오.

answer

α=P(Reject H0|H0True)

α=P(x>0.8|θ=1)

=0.811dx=[x]0.81=10.8=0.2

β=P(type 2 Error)=P(Not Reject H0|H0 False)

P(x<0.8|θ=2)

=00.812dx=[12x]00.8=0.8202=0.82=0.4

검정력 :1β=0.6

5.

X1,,XnN(0,σ2)으로부터의 랜덤표본이라고 하자

(a)

가설 H0:σ2=4 vs H1:σ2=9에 대한 최강력 검정의 기각역은

C={(x1,,xn):i=1nxi2c}

의 꼴로 주어짐을 보이시오.

answer

L(σ2)=Πi=1nf(x2:σ2)=Πi=1n12πσ2exi22σ2μ=0

=(12πσ2)n2ei=1nxi22σ2

네이만 피어슨 정의에 의하면, LR=L(H0)L(H1)=L(4)L(9)k

LR=L(4)L(9)=(12π4)n2ei=1nxi22×4(12π9)n2ei=1nxi22×9

=(94)n2ei=1nxi2(18118)

=(94)n2e572i=1nxi2k

e572i=1nxi2k

572i=1nxi2k

i=1nxi2k

기각역: c={(x1,,xn):i=1nxi2c)

(b)

표본의 크기가 n=20일 때 유의수준이 α=0.05이기 위한 상수 c의 값을 χ2분포의 분위수를 사용하여 표현하시오.

answer

α=P(Reject H0|H0True)

=P(i=1nxi2k|σ2=4)

=P(i=1nχi2σ2kσ2|σ2=4)

=P(i=120χi24k4|σ2=4)

image.png

k4=χ0.05(20)2

qchisq(0.95,20)
31.4104328442309
round(4*qchisq(0.95,20),2)
125.64

k=4χ0.05(20)2=125.64

c={(x1,,xn):i=1n125.64}

(c)

표본의 크기가 n=20일 때 (b)에서 찾은 기각역에 대한 제2종오류를 범할 확률을 구하시오.

answer

β=P(Not Reject H0|H1True)

=P(i=1nxi2k|σ2=9)

모집단 분포 XiN(0,σ2)

표준화 XiσN(0,1)

표분화 제곱 분포는 카이제곱 (Xi2σ)2χ12,i=1,2,,n

카이제곱의 합의 자유도 합 i=1n(Xiσ)2χ(n)2

=P(i=1nχi2σ2kσ2|σ2=9)

=P(i=120χi29k9|σ2=9)

k9=χ0.05(20)2

qchisq(0.95,20)
31.4104328442309
round(9*qchisq(0.95,20),2)
282.69

k=9χ0.05(20)2=282.69

c={(x1,,xn):i=1n282.69}

랜덤표본X1,X2,,Xn의 분포가 확률밀도함수 f(x;θ),θΩ를 따른다고 하자. 이때 표본과 모수 θ의 함수인 확률변량 T(X1,X2,,Xn;θ)의 분포가 모수 θ에 의존하지 않으면 이를 추축변량이라 한다.

6.

X1,X2,,XnN(μ,σ2)로부터 얻은 랜덤표본이라고 하자. 모평균 μ가 알려져 있지 않은 경우 H0:σ2=4 vs H1:σ24을 검정하고자 한다.

(a)

적절한 추축변량을 이용하여 σ2에 대한 100(1α) 신뢰구간을 구하시오.

answer

(XiX¯)2σ2=(n1)S2σ2χ(n1)2

P[χL(n1)S2σ2χU]=1α

P[χα/2(n1)S2σ2χ1α/2]=1α

P[(n1)S2χ1α/22σ2(n1)S2χα/22]=1α

((n1)S2χα/22,(n1)S2χ1α/22)

(b)

유의수준 α인 일반화 가능도비 검정 기각역을 구하시오.

answer

모평균 μ의 최대가능도 추정량은 가설에 관계없이 언제나 X¯

모분산 σ2의 최대가능도 추정량은 귀무가설 하에서는 4이며, 전체 모수공간Ω내에서는 σ^2=i=1n(XX¯)2n

일반화 가능도비 Λ(X1,X2,,Xn)=(i=1n(XiX¯n)24n)n/2×exp[12{i=1n{(XiX¯i)4}2+n2]

=(σ^24)n/2exp{(n2)(σ2^4)+n2}

Λ=σ^24n/2exp(n2σ^24+n2)

σ^24exp(σ^24)(λ)2/nexp(1)=c

σ^24<1일 때는 단조증가, σ^24>1일 때는 단조감소

기각영역 ; C={(x1,x2,,xn):(σ^24a 또는 σ^24b}

nσ^24=i=1n(XiX¯n)24χ2(n1)

P[i=1n(XiX¯n)24χ1α/22(n1)|H0]

=P[i=1n(XiX¯n)24χα/22(n1)|H0]

=α2

그러므로 카이제곱분포의 양쪽꼬리에서 α/2씩 고려한 일반화 가능도비 검정법의 근사꼴로서 기각영역은

i=1n(XiX¯n)24χ1α/22(n1)

또는 i=1n(XiX¯n)24χα/22(n1)

(c)

n=10이고 표본분산 S2의 관측값은 6이라고 한다. (b)의 일반화 가능도비 검정법으로 유의확률 (pvalue)을 구하시오.

answer

1-pchisq(6/4*9,9)
0.14125582649328