09wk: 확률변수

Author

GUEBIN CHOI

Published

May 2, 2023

강의영상

youtube: https://youtube.com/playlist?list=PLQqh36zP38-yGgU_c-5m38ONMFujHvYLf

확률변수 오개념 정리

확률공간과 용어들

- 동전예제에서의 확률공간 (Ω,F,P)를 가정하고 용어를 정리해보자.

  • outcomes: H,T
  • set of “outcomes”: Ω={H,T}
  • event: , {H}, {T}, {H,T}
  • set of “events”: F
  • probabilites: P:F[0,1]

그림1: 확률을 위한 기본용어

확률변수의 불완전한 정의

- 확률변수: X:ΩR조금 특별한 성질을 가진 함수

  • 정의역: Ω
  • 공역: R

(예제1) 동전예제

1. outcomes: H,T.

2. sample space: Ω={H,T}

3. event: , {H}, {T}, {H,T}.

4. σ-field: F=2Ω

5. probability measure function: P:F[0,1] such that

  • P()=0
  • P({H})=12
  • P({T})=12
  • P(Ω)=1

6. random variable: X:ΩR such that

  • X(H)=1
  • X(T)=0

만약에 편의상 Ω={H,T}={ω1,ω2}와 같이 사용한다면

  • X(ω1)=1
  • X(ω2)=0

헷갈려 (1) ()

- 질문1: 아래의 표현 중 옳은 것은?

  1. X(H)=0
  2. P({H})=12
  3. P({ω1})=12^
  4. P(H)=12
  5. P({H,T})=1
  6. P(ω1)=12

- 질문2: 질문1의 4번의 표현 많이 본적 있다. 예를들어서 고등학교에서 두 사건의 독립에 대해 배울때 아래와 같은 방식으로 표현했었다. // 출처: 네이버 블로그

두 사건 A, B에 대하여 P(B|A)=P(B|Ac)=P(B) 이면 두 사건이 독립이라고 한다~~

그렇다면 이 표현은 틀린걸까?

(해설)

여기에서 사건 A, B는 event을 의미하며 outcome을 의미하는게 아님. 즉 A, B는 집합임.

암기: 확률은 항상 집합을 입력으로 받아야 함!!

- 질문3(): 수리통계 시간에서 아래와 같은 표현 본 적 있다.

P(X=1)=12

그런데 P의 입력으로는 집합이 들어가야하는데, X=1은 그냥 수식임. 그렇다면 이 표현은 틀린 표현일까??

(해설)

사실 P(X=1)의 의미는 아래와 같은 표현의 축약형이다.

P({ω:X(ω)=1})

{ω:X(ω)=1}={ω1}={H} 를 의미하므로 결국

P(X=1)=P({ω:X(ω)=1})=P({H})

이 된다. 따라서 옳은 표현이다.

확률변수에 대한 통찰

- 아래와 같은 표현을 다시 관찰하자.

P(X=1)=P({ω:X(ω)=1})=P({H})

통찰1. 확률변수가 “함수”라는 사실을 떠올리고 1이라는 값이 확률변수의 “상(image)” 라는 사실을 떠올리면, {ω:X(ω)=1}은 1에 대한 “역상(inverse image)”이라고 해석할 수 있다.

통찰2. 확률변수의 상은 R에 맺히게 되고, 확률변수의 역상은 Ω의 부분집합 중 하나에 맺히게 된다.

통찰3. 문제는 확률변수의 역상이 잴 수 있는 집합에 맺힌다는 보장이 있냐라는 것이다… 즉 이 예제로 한정하면

{ω:X(ω)=1}F

임을 보장해야 한다는 것이다.

통찰4. 당연히 이러한 보장을 할 수는 없어보인다. 따라서 X를 단지 그냥

  • X:ΩR로 가는 함수

가 아니라

  • X:ΩR로 가는 함수 & 역상이 항상 잴 수 있는 집합이어야 함.

이라는 조건이 필요하다.

- 역상이 잴 수 있는 집합인 함수를 간단히 잴 수 있는 함수 (measurable function) 라고 한다.

헷갈려 (2) () – 확률변수에 대한 오해

오해1: 학률변수 = 값이 랜덤으로 바뀌는 변수??

  • 함수: y=f(x), f: function, x: input y: output
  • 확률변수: x=X(ω), X: function, ω: outcome, x: realization
  • 확률변수는 함수이지만 보통 X(ω)와 같이 쓰지 않고 X라고 쓴다. 혼란의 이유

오해2: 확률변수는 결과가 랜덤으로 변하는 함수??

  • 확률변수는 함수일 뿐임. 입력이 정해지면 출력이 고정임!
  • 동전예제: 입력이 ω=H이면 출력은 X(ω)=1, 입력이 ω=T이면 출력은 X(ω)=0으로 고정임!

오해3: 아니야.. 확률변수는 결과가 랜덤으로 바뀌는 느낌이 맞아. 아래의 예시를 봐!

X={0w.p.121w.p.12

  • X는 진짜 변수처럼 보이긴함.
  • 심지어 변수의 값이 랜덤으로 변하는 것 같음.

(해설)

정확하게는 아래 표현이 맞다.

X(ω)={0ω{H}1ω{T}where P({H})=P({T})=12.

- 확률변수에 대한 오해2에 대한 추가설명

  • 확률변수는 결과가 랜덤으로 변하는 함수가 아님, 확률변수는 함수일 뿐임. 입력이 정해지면 출력이 고정임!
  • 동전예제: 입력이 ω=H이면 출력은 X(ω)=1, 입력이 ω=T이면 출력은 X(ω)=0으로 고정임!
  • 단지 입력 outcome이 실험에 따라 랜덤으로 변할 수 있는 것임!!

- 요약해보면,

  1. 확률변수는 확률과 관련없다.
  2. 간접적으로는 관련이 있다. X의 역상 = Ω의 부분집합 = P의 정의역

확률변수

확률변수의 엄밀한 정의

- 확률변수 (머리속): X:ΩR 인 잴 수 있는 함수.

- 확률변수 (엄밀하게): 두 개의 잴 수 있는 공간 (Ω,F)(R,R)이 있다고 하자. 확률변수 X는 아래를 만족하는 함수 X:ΩR 이다.

BR:X1(B)={ω:X(ω)B}F

Note: {ω:X(ω)B}F for all BR 이라 쓰기도 함. 쓰는사람 마음~

정의에 대한 비판

- 왜 정의가 아래와 같지 않을까?

BR:X1(B)={ω:X(ω)B}F

위의 질문을 위한 보충학습

(예제) 바늘이 하나 있는 시계

1. outcomes: 0,π2,π,3π2,1,2,

2. sample space: Ω=[0,2π)

3. event: , [0,2π), {0},

4. σ-field: F

5. probability measure function: P such that

P([a,b))=ba2π

where 0a<b<2π.

6. random variable: X:ΩR such that X(ω)=ω

  • 6을 주목하자. 만약에 비탈리집합 V[0,1][0,2π)에 대한 inverse image는 비탈리집합 그 자체가 된다. 따라서 아래와 같이 된다.

P(XV)=P({ω:X(ω)V})=P(V)

  • 그런데 집합 V는 르벡메져로는 잴 수 없으므로 P(V)와 같은 표현을 불가함.

- 따라서 아래의 정의에서 BR 대신에 BR이라고 쓸 수 없다.

BR:X1(B)={ω:X(ω)B}F

- 결국확률변수를 정의하기 위해서 2개의 가측공간 (Ω,F), (R,R)이 필요함.

잴 수 있는 함수

- 교재의 정의1

그림2: Durret에서 긁어온 확률변수의 정의
  • X is F-measurable” 이라는 의미는, 모든 BR에 대하여 B의 inverse image가 F-measurable 하다는 의미.
  • X가 랜덤변수라는 것을 기호로 간단하게 XF 라고 씀.
  • 두개의 가측공간에 대한 언급은 매우 모호하게 되어있음.

- 교재의 정의2

그림3: Durret에서 긁어온 확률변수의 정의2
  • 측도의 개념을 정의하고 그 특수한 케이스로 확률측도를 정의하였듯이, 잴 수 있는 함수(measurable map)라는 개념을 정의하고 그 특수한 케이스로 확률변수(혹은 확률벡터)를 정의한다.
  • 두개의 가측공간이 명확하게 명시되어 있어서 좀 더 이해하기 쉽다.

- 우리는 좀 더 명확한 의미전달을 위해

  • X(Ω,F)(R,R)인 확률변수라고 하자
  • X(Ω,F)(S,S)인 잴 수 있는 함수 (가측함수)라고 하자

와 같은 문장을 쓰겠다.

확률변수의 체크

(1) 아래와 같은 measurable space를 고려하자.

  • Ω={a,b,c,d}
  • F=σ(A) where A={{a}}.

아래와 같은 function X:ΩR, Y:ΩR을 고려하자.

  • X(a)=1,X(b)=2,X(c)=3,X(d)=4
  • Y(a)=1,Y(b)=2,Y(c)=2,Y(c)=2

아래의 물음에 답하라.

  • X(Ω,F)(R,R)인 확률변수인가?
  • Y(Ω,F)(R,R)인 확률변수인가?

(풀이)

X는 확률변수가 아님

집합 {2}R에 대하여 {ω:X(ω){2}}={b}σ(A) 이므로 X는 확률변수가 아님

Y는 확률변수임

BR에 대하여 Y1(B)F가 성립함.

  • {ω:Y(ω)}=σ(A)
  • {ω:Y(ω){1}}={a}σ(A)
  • {ω:Y(ω){2}}={b,c,d}σ(A)
  • {ω:Y(ω){1,2}}={a,b,c,d}σ(A)
  • 위에서 언급되지 않은 BR에 대해서는 모두 Y1(B)=σ(A)가 성립함.

(2) 두개의 잴 수 있는 공간 (Ω,F)(S,S)를 고려하자. 단,

  • Ω=R,
  • F=σ(A) where A={Q},
  • S={0,1},
  • S=2S.

아래와 같은 함수 X:ΩS을 고려하라.

X(ω)={0ωQ1ωRQ

X(Ω,F)(S,S)인 가측함수인가?

(풀이) 잴 수 있는 함수임.

Note: σ(A)={,Q,Qc,R},2S={,{0},{1},{0,1}}

잴 수 있는 함수임을 체크하기 위해서는 2S의 모든 원소 B에 대하여 X1(B):={ω:X(ω)B}F 임을 확인하면 된다.

  • B= 일 경우: {ω:X(ω)}=σ(A)
  • B={0} 일 경우: {ω:X(ω){0}}=Qσ(A)
  • B={1} 일 경우: {ω:X(ω){1}}=Qcσ(A)
  • B={0,1} 일 경우: {ω:X(ω){0,1}}=Rσ(A)

이 문제에서 (S,S)(R,R) 바꾸면 풀이의 약간만 수정하여 XF임을 보일 수 있다.

(3) 두개의 잴 수 있는 공간 (Ω,F)(S,S)를 고려하자. 단,

  • Ω=R,
  • F=σ(A) where A={Q},
  • S={0,1},
  • S=2S.

아래와 같은 함수 X:ΩS을 고려하라.

X(ω)={0ω=01ω0

X(Ω,F)(S,S)인 가측함수인가?

(풀이) 잴 수 있는 함수가 아님. B={0} 일 경우, {ω:X(ω)B}={0}σ(A) 이므로 잴 수 있는 함수의 정의에 만족하지 않음.

이 문제에서 (S,S)(R,R) 바꾸면 풀이의 약간만 수정하여 XF임을 보일 수 있다.

Footnotes

  1. outcome 자체는 집합을 의미하는게 아님↩︎

  2. event는 집합을 의미↩︎

  3. 1,2,3,5 가 옳은표현↩︎

  4. 참고로 image는 수학책에서 3가지 뜻으로 혼용해서 쓰이는데, 이 문맥에서는 “Image of an element”를 의미함. ref↩︎

  5. F-measurable↩︎

  6. F-measurable↩︎

  7. 입력인데 outcome임, 여기서부터 너무 헷갈려!!↩︎

  8. P[a,b)에서만 정의했는데도 어떻게 (Ω,F)에서의 메져라고 주장하냐고? 카라테오도리의 확장정리!↩︎

  9. 사실 X:[0,2π)[0,2π) 임. 즉 X는 항등함수↩︎