2<... in ai->1. Naj
bo X slučajna spremenljivka. Katere funkcije so merljive glede na G? To so funkcije, ki so konstantne na [ai,ai+1) za
vse i=0,1,2,... Vemo, med katerimi funkcijami iščemo E(X|G). Kolikšna bo vrednost E(X|G) na [ai,ai+1)? To bo kar
povprečna vrednost 1/(ai+1-ai)·∫[ai,ai+1)X(ω)dω.
(ii) Po poti smo govorili o E(X|Y). Ugotovili smo (vsaj v diskretnem primeru), da je E(X|Y)=ψ(Y) za neko funkcijo ψ. Definirali smo E(X|σ(Y)).
Tehnična lema: Naj bo Z σ(Y)-merljiva slučajna spremenljivka. Potem obstaja Borelova funkcija ψ, da velja ψ(Y)=Z. S to tehnično
lemo v rokah lahko rečemo, da je E(X|Y)=E(X|σ(y))=ψ(Y) za neko funkcijo ψ. Za diskreten primer je to vse skupaj trivialno, tj. če je
(X,Y) diskreten, so trditve trivialne.
(iii) Večina pogojnih matematičnih upanj bo oblike E(X|Y) ali E(XwY1,...,Yn)=E(X|σ(Y1,...,
Yn)), kjer je σ(Y1,...,Yn) najmanjša σ-algebra, glede na katero so Yi merljive.
Nadaljna verzija tehnične leme pove, da je E(X|Y1,...,Yn)=ψ(Y1,...,Yn).
(iv) Pogosto lahko pogojno matematično upanje uganemo, vendar to ni
dokaz. Imamo samo osumljenca. Dokazati moramo, da je osumljenec G-merljiv in da
je E(osumljenec· IG)=E(X·IG).
LEMA 2.10 : Naj bosta X1, X2 slučajni spremenljivki, tako da velje
E|X1|<∞ in E|X2|<∞. Naj bo GЄF σ-algebra. Velja:
(i)
E(αX1+βX2|G)=αE(X1|G)+βE(X2|G)
(ii) Če je X1≥0, je
E(X1|G)≥0
(iii) Naj bo U G-merljiva in E|UX1|<∞. Potem je E(UX1|G)=
U·E(X1|G)
(iv) Naj bo HЄG σ-algebra. Velja: E(X1|H)=E(E(X1|G)|H)
(="TOWER PROPERTY")
(v) Naj bo Φ:R->R konveksna in E(|Φ(X1)|)<∞.
Potem velja: E(Φ(X1)|G)≥Φ(E(X1|G)). (=JENSENOVA NEENAKOST)
NAZAJ NA KAZALO!
Primeri izračuna matematičnega upanja
Primer1: Naj bosta X in Y neodvisni slučajni spremenljivki in f:R2->R merljiva,
taka, da je E|f(X,Y)|<∞. Računamo pogojno matematično upanje E(f(X,Y)|Y). Vemo, da je odgovor oblike ψ(Y) za
neko merljivo funkcijo ψ. Iščemo to funkcijo. Intuitivna ideja: "Pogojno matematično upanje je matamatično upanje pri danem Y". Ker je
X neodvisen od Y, se lahko "pretvarjamo", da je Y konstanta, torej rečemo: ψ(y)=E(f(X,y))=∫Rf(x,y)μX(dx).
Dokazati moramo:
(i) ψ je merljiva in skoraj povsod <∞:
Glej drobovje Fubinijeve konstrukcije
za merljivost.
(ii) ψ(Y) je osumljenec. Merljivost glede na σ(Y) je jasna.
Stranski komentar: po definiciji mora veljati
E(E(X|Y)1G)=E(X1G) za vsak GЄσ(Y). Vsak tak G je oblike G=Y-1(B) za neko merljivo množico B.
Z drugimi besedami: 1G=1B(Y). S trivialno uporabo izreka o monotoni konvergenci in aproksimacijo nenegativnih
omejenih merljivih funkcij z enostavnimi dobimo, da velja (*) E(E(X|Y)·g(Y))=E(X·g(Y)) za vsak omejen merljiv g≥0. Če preverimo (*),
smo preverili tudi definicijo. (podrobnosti-predavanja)
Primer2: Naj imata X,Y gostoto fX,Y. Računamo E(X|Y) ali bolj splošno E(Φ(X)|Y). Predpostavljamo
E|X|<∞ in E|Φ(X)|<∞. Vemo: E(Φ(X)|Y)=ψ(Y) za nek ψ. Kandidat za ψ
bi bil
Preverimo pravilnost odgovora: merljivost in končnost funkcije ψ sledita iz Fubinijeve konstrukcije.
(podrobnosti-predavanja)
Primer3: Naj bosta (X,Z) in (Y,Z) slučajna vektorja z enako porazdelitvijo. Ali je potem E(X|Z)=E(Y|Z)? (s.g.=
skoraj gotovo) Vemo: če imamo gostoto, potem to velja. Poglejmo: E(X|Z)=ψ1(Z) in E(Y|Z)=ψ2(Z). Po definiciji
je E(E(X|Z)·g(Z))=E(X·g(Z)) in E(E(Y|Z)·g(Z))=E(Y·g(Z)).
Ker sta (X,Z) in (Y,Z) enako porazdeljena, velja enakost E(X·g(Z))=E(Y·g(Z)). Sledi:
E(ψ1(Z)·g(Z))=E(ψ2(Z)·g(Z)) za vsako merljivo g≥0. Če
vzamemo za g karakteristično funkcijo g(z)=1(ψ1(z)>ψ2(z)), dobimo P(ψ1(Z)>ψ2(Z))=0.
Z zamenjavo vlog dobimo še obratno neenakost in zato velja ψ1(Z)=ψ2(Z) s.g.
Opomba: To ne pomeni, da je ψ1=ψ2, ampak le ψ1(Z)=ψ2(Z).
Uporaba: Naj bo (X1,...,Xn) slučajni vektor z neodvisnimi, enako porazdeljenimi komponentami. Naj bo
Sn=X1+...+Xn. Predpostavljamo E|X1|<∞. Računamo E(X1|
Sn).
Uganemo: E(X1|Sn)=Sn/n.
Preverimo na naslednji način:
Vsi pari (Xi,Sn) so enako porazdeljeni.
Sledi: E(X1|Sn)=E(X2|Sn)=...=E(Xn|Sn) s.g.
Seštejemo in dobimo: E(X1|Sn)+...+E(Xn|Sn)=E(Sn|Sn)=Sn s.g. Po
drugi strani pa je E(X1|Sn)+...+E(Xn|Sn)=n·E(X1|Sn). Sledi:
n·E(X1|Sn)=Sn => E(X1|Sn)=Sn/n.
Opomba: Isti razmislek deluje, če vemo, da imajo pari (Xi,Sn) enako porazdelitev. Primer takega pogoja je
izmenljivost: X1,...,Xn so izmenljive, če je porazdelitev (Xσ(1),...,Xσ(n)) enaka
za vsako permutacijo σЄSn.(=simetrična grupa)
Primer4: Če sta X,Y neodvisni, je E(X|Y)=E(X). Naj bo vektor
Računamo E(X|Y). Ideja: Ali lahko najdemo
tako konstanto α, da bosta spremenljivki X-αY in Y neodvisni? Dovolj je, ker je (X-αY,Y) večrazsežen, normalen, da je
cov(X-αY,Y)=0. Računamo: cov(X-αY,Y)=cov(X,Y)-αcov(Y,Y)=σ12-ασ22=0. Dobimo
α=σ12/σ22. Sledi: E(X-αY|Y)=E(X-αY)=μ1-αμ2. Po drugi
strani pa je E(X-αY|Y)=E(X|Y)-αY. Dobimo rezultat: E(X|Y)=μ1+α(Y-μ2) za α=σ12/σ22.
Posplošimo: Če je X1 neodvisna od (X2,...,Xn), je E(X1|X2,...,Xn)=
E(X1). Naj bo X=(X1,...,Xn)~N(μ,Σ), kjer je
Zanima nas E(X1|
X2,...,Xn). Poskusimo odšteti X1 neko linearno kombinacijo X2,...,Xn, tako, da bo
rezultat neodvisen od (X2,...,Xn). Iščemo izraz oblike X1-aTX', X'=
(X2,...,Xn)T, aT=(a2,...,an). Izračunamo kovarianco:
cov(X1-aTX',X')=cov(X1,X')-aTcov(X',X')=
σ1-aTΣ'=0. Sledi: a=(Σ')-1σ1T.
Dobimo: E(X1-aTX'|X')=E(X1-aTX')=μ1-aTμ'=
E(X1|X')-aTX'. Torej je E(X1|X')=
μ1+aT(X'-μ').
NAZAJ NA KAZALO!
Pogojne porazdelitve
Začeli bomo s formulo P(A|B)=P(A∩B)/P(B), P(B)≥0. Recimo, da je X slučajna spremenljivka in B dogodek s P(B)>0. Definirali smo E(X|B)=
E(X·1B)/P(B). Kaj bi bila definicija pogojne porazdelitve X glede na B? Porazdelitev je v načelu mera na prostoru, kjer
ima X svoje vrednosti. Označimo začasno pogojno porazdelitev z μX(*|B). Kaj bi bila ta mera? μX(A|B)=
P({XЄA}∩B)/P(B). Preverimo, da velja: E(X|B)=∫RxμX(dx|B) (če je X realna slučajna
spremenljivka). Računamo za X≥0:
Pogojno matematično upanje je integral pogojne porazdelitve.
Opomba: Če X ni nenegativna, gledamo X+ in X-.
Naslednji korak: Recimo, da sta X in Y diskretni slučajni spremenljivki. Definirati znamo: μX(*|{Y=yl})=
P({XЄ*}∩{Y=yl})/P(Y=yl)=Q(*,yl); vlogo B igra {Y=yl}. Q je funkcija dveh spremenljivk.
Prva spremenljivka je merljiva množica, druga pa možna vrednost Y. Kaj lahko rečemo o funkciji, ki slika A v Q(A,yl)? Funkcija
Q:A->Q(*,yl) (za fiksen yl) je mera. Smiselno je definirati Q(*,yl) kot pogojno porazdelitev X glede na
{Y=yl}. Ponovimo razmislek Kolmogorova: Za različne yl dobimo različne pogojne porazdelitve (ali različne mere).
Ampak yl so možne vrednosti neke slučajne količine Y. Podobno kot pri matematičnih upanjih si drznemo reči, da bo pogojna
porazdelitev X glede na Y neka "slučajna mera" (odvisna od Y). Kakšna bi bila pa splošna definicija pogojne porazdelitve? Po istem
razmisleku kot pri pogojnih matematičnih upanjih, bomo definirali POGOJNO PORAZDELITEV slučajne spremenljivke X glede na GЄF, kjer je G
σ-algebra. Kakšne bi bile zahteve?
(i) Če označimo s Q:BxΩ->[0,1] pogojno porazdelitev, lahko gledamo funkcijo
ω->Q(A,ω) za fiksen A. Zahtevali bi G merljivost.
(ii) Funkcija A->Q(A,ω) je mera za fiksen ω.
(iii)
Veljati mora E(1(XЄA)|G)=Q(A,*).
Vprašati se moramo:
(1) Ali tak objekt obstaja?
(2) Ali je enolično določen?
Odgovor:
(1) V splošnem Q ne obstaja. V splošnem je X slučajna spremenljivka z vrednostmi v metričnem prostoru (M,d). Če je (M,d)
poljski prostor (tj. v neki ekvivalentni metriki je poln in separabilen), potem Q obstaja.
(2) Enoličnost je preprosta do s.g.
Komentar k zahtevi (iii) E(1(XЄA)|G)=Q(A,*): Ker je pogojno matematično upanje linearno, velja za vsako enostavno funkcijo f,
da je E(f(X)|G)(ω)=∫Mf(x)Q(dx,ω). Kaj če je f nenegativna, merljiva in omejena? Za pogojna matematična
upanja velja LMK v smislu: če Y12<...->Y, Yn≥0, E(Y)<∞, potem E(Y1|G)2|G)<...->E(Y|G).
Za omejeno f≥0 takoj sledi, da je E(f(X)|G)(ω)=∫Mf(x)Q(dx,ω).
Še en dodatek: Če je X≥0, lahko iz istega LMK dobimo E(X|G)(ω)=∫RxQ(dx,ω).
Primeri: (i) Če sta X in Y diskretni, definiramo najprej Q'(A,y)=P(XЄA,Y=y)/P(Y=y) za P(Y=y)>0. Pogojna
porazdelitev X glede na Y (ali σ(Y)) je Q(A,ω)=Q'(A,Y(ω)). Trivialno preverimo zahteve.
(ii) Naj bosta X,Y slučajni spremenljivki z gostoto fX,Y na R2. Definirajmo:
Pogojna porazdelitev
je Q(A,ω)=Q'(A,Y(ω)). Preverjanje je rutinsko. (Sredstvo je drobovje Fubinijevega izreka!) V čem je ideja? Pričakujemo, da je
pogojna gostota X glede na Y proporcionalna funkciji x->fX,Y(x,y).
(iii) Naj bosta X, Y neodvisna slučajna vektorja z vrednostmi v Rm. Kaj je pogojna porazdelitev
Z=X+Y glede na Y? Ideja: Če bi X prišteli fiksen vektor, bi se porazdelitev prestavila za tisti fiksni
vektor. Če pa prištevamo neodvisni slučajni vektor, porazdelitev X "slučajno" prestavimo. Ideja: Q(A,ω)=μX(
A-Y(ω)). Pri preverjanju nastopi tehnična motnja: dokazati moramo, da je funkcija y->μX(A-y) merljiva
za fiksen y. To gre z Dynkinovo lemo. Ostala preverjanja so rutinska.
NAZAJ NA KAZALO!
2.6 Martingali
Najprej potrebujemo nekaj definicij.
Definicija: Naraščajočemu zaporedju σ-algeber F0⊆
F1⊆ F2⊆...⊆F rečemo FILTRACIJA
(prostora Ω).
Pojem martingala je motiviran s "fair" igrami na srečo. Kar pričakujemo v naslednji igri je enako temu, kar trenutno imamo.
Definicija: Naj bo {Fn} filtracija. Zaporedje parov (Xn,Fn), kjer je Xn slučajna
spremenljivka z E(|Xn|)<∞ za n≥0 je MARTINGAL, če velja: E(Xn+1|Fn)=
Xn za n≥0.
Dodatek: Za vsak n mora biti Xn Fn-merljiva.
Komentar: Fn interpretiramo kot "preteklost" do vključno trenutka n.
Definicija: (i) (Xn,Fn) je SUB-MARTINGAL, če je E(Xn+1|Fn)≥Xn
skoraj gotovo.
(ii) (Xn,Fn) je SUPER-MARTINGAL, če je E(Xn+1|Fn)≤Xn
skoraj gotovo.
Primeri: (i) Naj bodo X0,...,Xn slučajne spremenljivke, ki so neodvisne in velja
E(Xi)=0 za vse i. Naj bo Fn=σ(X0,...,Xn) in Sn=X0+...+Xn.
(Sn,Fn) je martingal. Računamo:
E(Sn+1|Fn)=E(Xn+1+Sn|X0,...,
Xn)=E(Xn+1|X0,...,Xn)+E(Sn|X0,...,Xn)=E(Xn)+Sn=Sn, saj je E(Xi)=0 za vsak i.
(ii) Naj bodo X1,X2,... neodvisne, enako porazdeljene s P(Xi=1)=p in P(Xi=-1)=1-p=q
za p≠1/2. Definiramo Fn=σ(X1,...,Xn), Sn=X1+...+Xn, X0=0.
Naj bo Yn=(q/p)Sn. To je De Moivrov martingal.
Preverimo:
Oglejmo si sedaj nekaj preprostih posledic definicij.
Posledica1: Naj bo m>n. Potem je E(Xm|Fn)=E(E(Xm|Fm-1)|Fn)=E(Xm-1|
Fn)=...=E(Xn|Fn)=Xn.
Posledica2: Iz prve posledice takoj sledi opazka, da za m>n in GЄFn
velja E(Xm·1G)=E(Xn·1G).
Opomba: Obe posledici veljata tudi za sub-martingal, tj. E(Xm|Fn)≥Xn in E(Xm·1
G)≥E(Xn·1G).
Posledica3: Iz druge posledice ali iz definicij takoj sledi, da je E(X0)=E(X1)=E(X2)=...=
E(Xn)=...
Za sub-martingal pa velja E(X0)≤E(X1)≤E(X2)≤...≤E(Xn)...
Motivacija za koncept opcijskega časa:
Pri igrah na srečo lahko "izstopimo" v slučajnem trenutku T.
Primer: Igramo, dokler
dvakrat zapored ne izgubimo, potem nehamo, tj. ko dvakrat zapored izgubimo, nehamo igrat. T postane slučajna spremenljivka z vrednostmi
v splošnem 0,1,2,...;∞ (=to je zapis za {0,1,2,...}U{∞}). Kakšni T-ji pridejo v
poštev, če izključujemo jasnovidnost? To pomeni, da izstopimo na podlagi "informacije", ki jo "imamo na razpolago" do T. Kako to opisati
matematično? Oglejmo si dogodek {T≤n} za n≥0. Če se ta dogodek zgodi, smo se za izstop odločili na podlagi prvih n iger. Kateri objekt
"vsebuje" dogodke v zvezi s prvimi n igrami? To je Fn!
Definicija: Slučajna spremenljivka T:Ω->{0,1,...;∞} je OPCIJSKI ČAS, če velja, da je T F-merljiva
in da je za vsak n≥0 dogodek {T≤n}ЄFn.
Opomba: Take T lahko razumemo kot strategije brez jasnovidnosti.
Primer: (i) Naj bodo X0,X1,...celoštevilske slučajne spremenljivke. Definiramo
T=inf{n≥0: XnЄA} s konvencijo inf{{}}=∞. Pokažimo, da je to opcijski čas: {T≤n}=
U{XkЄA}, k=0,...,n. Sledi {T≤n}ЄFn.
(ii) T=inf{n≥1: Xn≥Xn-1},
inf{{}}=∞. Preverimo: {T≤n}=U{Xk≥Xk-1}, k=1,...,n. Sledi {T≤n}ЄFn.
LEMA 2.11 : Naj bo (Xn,Fn) martingal (oz. sub-martingal). Naj bo T omejen opcijski čas. (Kot
funkcija ima zgornjo mejo.) Potem velja: E(XT)=E(X0) (oz. E(XT)≥E(X0)).
Opomba: Formalno je XT=X(ω)T(ω).
Posledica: Recimo, da igramo ruleto in je X0,X1,...naše premoženje v trenutkih n=0,1,...Stave pri
ruleti so take, da v povprečju vedno izgubimo. V matematiki se to prevede v izjavo, da je X0,X1,...super-martingal
glede na Fn=σ(X0,X1,...,Xn). Za super-martingal in omejen opcijski čas T≤N je
E(XT)≤E(X0)=x0=neka konstanta, tj. začeten kup denarja. T je strategija.
Sklep: Vse strategije
v omejenem času, ki niso jasnovidne, v povprečju izgubljajo.
Kaj pa strategije, ki niso omejene v času? Uporabimo naslednji trik:
Če sta T in S opcijska časa, je tudi T/\S=min{T,S} opcijski čas. Preverimo: {T/\S≤n}={T≤n}U{S≤n}ЄFn.
Konstante so opcijski časi, torej je T/\S opcijski čas. Vemo,da lema 2.11 velja za omejene T. Dosti T je neomejenih.
Protiprimer: Naj bodo X1,X2,... neodvisne slučajne spremenljivke, tako da je
P(Xi=1)=P(Xi=-1)=1/2. Definiramo S0=0, Sn=X1+...+Xn,
Fn=σ(S0,S1,...,Sn). Velja: (Sn,Fn) je martingal.
Definiramo
T=inf{n;Sn=1}. Zlahka dokažemo, da je P(T < ∞)=1. Očitno je E(S0)=0, E(ST)=1
(ker je P(ST=1)=1) in zato lema 2.11 NE VELJA!
Kakšne predpostavke potrebujemo? Vemo, da je T/\N opcijski čas in velja
E(XT/\N)=E(X0) (po lemi 2.11). Po drugi strani je res: E|XT-XT/\N|=E(|XT-XN|·1(T>N))≤
E(|XT|·1(T>N))+E(|XN|·1(T>N)).
Če je P(T<∞)=1 (sicer razprava ni smiselna) je lim XT/\N=XT, ko N->∞.
Vemo: E(XT)=E(limXT/\N) za N->∞. Kakšne predpostavke potrebujemo?
LEMA 2.11(a) : Naj bo (Xn,Fn) martingal (oz. sub-martingal). Naj bo T opcijski čas z
P(T<∞)=1.
Naj velja:
(i) E|XT|<∞
(ii)
limsup E|XN|·1(T>N)=0.
Potem je E(XT)=E(X0) (oz. E(XT)≥E(X0)).
Primer: Naj bodo X1,X2,...neodvisne, enako porazdeljene slučajne spremenljivke in
P(Xi=1)=p, P(Xi=-1)=q, p≠q, S0=0, Sn=X1+...+Xn. Vemo, da je Mn=
(q/p)Sn martingal. Skica:
Definirajmo T=inf{n≥1; SnЄ{a,b}}. Očitno je |MT|≤M
za nek M. Dokazali smo že, da je P(T<∞)=1. Oglejmo si še |MN|·1(T>N). Zlahka se
prepričamo, da je ta izraz ≤A·1(T>N) za nek A (na 1(T>N) ima MN kvečjemu končno mnogo različnih
vrednosti). Oba pogoja sta izpolnjena. Sledi: E(MT)=E(M0)=1 po lemi 2.11(a). Po drugi strani je: MT=
(q/p)a·1(ST=a)+(q/p)b·1(ST=b).
Sledi: 1=E(MT)=(q/p)a·P(ST=a)+(q/p)b·P(ST=b). Torej je 1-(q/p)a=((q/p)b-
(q/p)a)·P(ST=b). Rezultat:
Primer (Maksimalna neenakost): Pogosto je potrebno oceniti verjetnost P(maxXn≥C)
za 1≤n≤N. Če je Xn sub-martingal, lahko to verjetnost ocenimo. Kako? Izmislimo si ustrezen opcijski čas in uporabimo lemo 2.11.
Dobimo: P(maxXn≥C)≤E(XN)/C za 1≤n≤N. (podrobnosti-predavanja)
Če Xn niso nenegativni, vzamemo Xn+=max(0,Xn). Zaradi Jensenove neenakosti (x->max(0,x) je
konveksna) je E(Xn+1+|Fn)≥E(Xn+1|Fn)+≥Xn+.
Iz tega sledi, da je (Xn+,Fn) tudi sub-martingal. Za C > 0 je potem po istem postopku
P(maxXn≥C)≤E(XN+)/C (maksimalna neenakost).
Opomba: Elementarno velja za Y≥0, da je P(Y≥C)≤E(Y)/C.
Primer: Vrnimo se k primeru rulete. Xn je super-martingal. Recimo, da imamo končno kredita L, kar
pomeni Xn≥-L za vse n. Lema 2.11 pravi, da je E(XT/\N)≤E(X0)=x0. Predpostavimo, da je
P(T<∞)=1. Potem XT/\N->XT, ko N->∞. Vemo (po Fatoujevi lemi)
da je E(XT)=E(liminfXT/\N)≤liminf E(XT/\N)≤liminf x0=x0, pri čemer gre N->∞.
NAZAJ NA KAZALO!
3. TRANSFORMACIJE IN KONVERGENCE SLUČAJNIH SPREMENLJIVK
3.1 Rodovne funkcije in procesi razvejanja
Za zaporedje c0,c1,c2,... lahko formalno
definiramo potenčno vrsto G(z)=Σckzk;
ck,zЄC in k=0,...,∞. Tej funkciji rečemo RODOVNA FUNKCIJA zaporedja {ck}.
Če ta potenčna vrsta konvergira za vse |z|≤ρ, ρ>0, potem G natanko določa koeficiente ck, recimo po formuli
za Kr={z: |z|=r} in 0<r<ρ.
Ideje za rodovne funkcije so imeli De Moivre, Stirling in Euler. Ideja: V rodovno
funkcijo lahko "zapakiramo" porazdelitev nenegativne celoštevilske slučajne spremenljivke kot GX(s)=ΣP(X=k)sk=
E(sx) in k=0,...,∞.
Opomba: Razumemo 00=1.
Za primer izračunajmo nekaj rodovnih funkcij:
(i) X~Geom(p)
(ii) X~Po(λ)
Komentarji:
(i) Ker je ΣP(X=k)=1, je G(1)=1 in potenčna vrsta konvergira enakomerno za |s|≤1.
(ii) Za |s|<1 je GX(s) neskončnokrat zvezno odvedljiva.
LEMA 3.1 : (i) GX enolično določa porazdelitev nenegativne celoštevilske slučajne spremenljivke X.
(ii) Če sta X,Y neodvisni, nenegativni, celoštevilski slučajni spremenljivki, je GX+Y=GX·GY.
(iii) Velja E(X)=limGX'(s) za s->1 in bolj splošno: E(X·(X-1)·...·(X-k+1))=limGX(k)(s) in s->1.
Primer: Naj bo X celoštevilska, nenegativna, dana s predpisom
za k=0,1,... in β,a>0.
Izračunajmo rodovno funkcijo. Najprej potrebujemo majhen trik:
Računamo:
Primer (mešane porazdelitve): Naj bosta X in Λ slučajni spremenljivki in naj za k=0,1,...velja
Podali smo torej pogojno porazdelitev X glede na Λ. Pogojno na Λ ima X Poissonovo porazdelitev s parametrom Λ. Naj bo
Λ~Γ(a,λ). Kakšna je porazdelitev X? Izračunajmo GX:
Če bi pisali β namesto λ, bi še prej spoznali
rodovno funkcijo-glej rezultat prejšnjega primera!
NAZAJ NA KAZALO!
Procesi razvejanja
Leta 1871 je Sir Francis Galton (1822-1911) postavil naslednje vprašanje: vzemimo angleškega aristokrata. Predstavljajmo si
(tj. predpostavljajmo), da bo imel k potomcev z verjetnostjo pk za k=0,1,... Vsak od potomcev bo imel spet slučajno število
potomcev, neodvisno od ostalih. k potomcev bo imel z verjetnostjo pk. Rodbina se nadaljuje po tem ključu.
Vprašanje:
Kolikšna je verjetnost, da rodbina začetnega aristokrata izumre?
Problem je rešil Reverend H.W.Watson, leta 1874 z rodovnimi
funkcijami. Za matematično obravnavo moramo jasno povedati predpostavke:
(i) Predpostavljali bomo, da so generacije simultane, tj.
da ne pride do zamika.
(ii) Števila potomcev posameznikov v n-ti generaciji so neodvisne slučajne spremenljivke.
Potrebujemo
še nekaj oznak: Rodovno funkcijo števila posameznikov označimo z G, torej G(s)=Σpksk. Število posameznikov
v n-ti generaciji označimo z Zn, n=0,1,...
Možen graf dogajanja:
Predpostavke moramo prevesti v bolj matematični jezik.
Vzemimo (zelo formalno) neskončen nabor slučajnih spremenljivk {ζij}i,j≥1, kjer so ζij
neodvisne, enako porazdeljene, nenegativne, celoštevilske slučajne spremenljivke, z rodovno funkcijo G. Postavimo Z0=1,
Z1=ζ11, Z2=ζ21+ζ22+...+ζ2Z1, ...,
Zn+1=ζn+1,1+...+ζn+1,Zn.
Opomba: Če je Zn=0, je Zn+1=0.
Opomba: Ker so ζij neodvisne, je Zn neodvisna od ζn+1,1,...,ζn+1,Zn-1.
Potrebujemo lemo:
LEMA 3.2 : Naj bodo ζ1,ζ2,... neodvisne, enako porazdeljene, nenegativne,
celoštevilske slučajne spremenljivke. Naj bo N od njih neodvisna, nenegativna, celoštevilska slučajna spremenljivka. Definiramo:
X=ζ1+...+ζN. Velja: GX(s)=GN(Gζ1(s)).
Kaj ta lema pomeni za proces razvejanja? Vemo, da je Zn+1=ζn+1,1+...+ζn+1,Zn in Zn
je neodvisen od ζn+1,1,ζn+1,2,... Označimo rodovno funkcijo Zn z Gn. Sledi:
Gn+1(s)=Gn(G(s)). Dobimo rekurzivno formulo za rodovne funkcije.
Opomba: Predpostavke lahko zelo kompaktno strnemo v E(sZn+1|Zn,Zn-1,...,Z0)=G(s)Zn.
Nadaljujmo s procesom razvejanja: Označimo An={Zn=0}. Velja:
A1⊆A2⊆A3⊆... (tj. ko
rodbina enkrat izumre, je ni več). Dogodek {rodbina izumre} je enak uniji UAn, n=1,...,∞, tj. vsaj
ena generacija mora biti prazna. Po lemi 1.2 je η:=P(UAn)=limP(An), n=1,...,∞. Kako
izrazimo P(An)=P(Zn=0) z rodovnimi funkcijami? Velja: P(Zn=0)=Gn(0). Sledi η=limGn(0),
ko n->∞. Iz rekurzije pa sledi: Gn+1=G◦G◦..◦G=G◦Gn (kompozitum je asociativen).
Torej je: η=limGn+1(0)=limG(Gn(0))=G(limGn(0))=G(η), ko n->∞.
Sklep:
η=P(rodbina izumre) je fiksna točka funkcije G na intervalu [0,1]. η=1 je vedno fiksna točka. Ni pa nujno edina! Prava
verjetnost je NAJMANJŠA fiksna točka funkcije G na [0,1]. (podrobnosti-predavanja)
IZREK 3.3 : Naj bo Z0,Z1,... proces razvejanja in označimo z μ=E(Z1)=pričakovano
število potomcev. Potem velja:
(i) Če je μ<1, je η=1.
(ii) Če je μ>1, je ηЄ[0,1).
(iii) Če je
μ=1 in var(Z1)>0, je η=1.
Opomba: Zakaj v točki (iii) predpostavljamo, da je var(Z1)>0? Če tega ne predpostavimo, ostane naslednji primer:
Torej: P(Butalci forever)=1. Butalska rodovna funkcija je G(s)=s.
Recimo, da je ηЄ[0,1), torej μ>1. Kaj se dogaja z velikostjo populacije, če rodbina ne izumre? Problema se bomo lotili z martingali.
Oglejmo si Xn=ηZn, kjer je η fiksna točka in ηЄ[0,1). Definiramo Fn=
σ(Z0,Z1,...,Zn). Zaporedje (Xn,Fn) je martingal. Zakaj? Predpostavke o procesu
razvejanja smo strnili v to, da je E(sZn+1|Z0,...,Zn)=G(s)Zn. Vstavimo
s=η in trditev sledi.
EKSKURZIJA V MARTINGALE:
Definicija: Zaporedje slučajnih spremenljivk X1,X2,... z vrednostmi v R (ali v (M,d)) KONVERGIRA
SKORAJ GOTOVO glede na P, če je P({w: Xn(w) konvergira})=1. Oznaka:
Opomba: (i) V načelu bi morali dokazati, da je dogodek v P(...) merljiv. Vendar ga zlahka napišemo s števnimi unijami in preseki.
(ii) V teoriji mere temu pravimo konvergenca skoraj povsod.
IZREK 3.4 : Naj bo (Xn,Fn) sub-martingal. Naj velja liminfE(Xn+)<∞;
(X+=max(0,X)). Potem zaporedje Xn konvergira
s.g. proti X∞
za neko slučajno spremenljivko X∞, ko n->∞.
Kaj ta izrek pove o procesu razvejanja? Vemo, da je Xn=ηZn martingal. Ker je ηЄ[0,1) in
ZnЄ{0,1,2,...}, je Xn omejen, torej je predpostavka iz izreka 3.4 utemeljena oz. izpolnjena. Torej Xn
konvergira s.g. Na dogodku {rodbina izumre} je ta limita enaka 1. Označimo X∞=limXn s.g.,
n->∞ in A={Zn=0 za nek n≥1}. Po LDK velja: E(X∞)=
E(limXn)=limE(Xn)=limη=η, n->∞.
Po drugi strani zapišemo:
E(X∞)=E(X∞·1A+X
∞·1AC)=E(1A+X∞
·1AC)=P(A)+E(X∞·1AC)=
η+E(X∞·1AC). Ko izraza enačimo, dobimo:
η=η+E(X∞·1AC).
Iz tega sledi, da je E(X∞·1AC)=0. Torej je X∞=0
na AC, ker je X∞≥0 s.g.! (podrobnosti-predavanja)
Vrnimo se sedaj h konvergenci martingalov. Najprej potrebujemo preprosto neenačbo za sub-martingal. Če je (Xn,Fn)
sub-martingal in sta T in S opcijska časa z 0≤S≤T≤N, potem velja: E(XS)≤E(XT).
Zdaj pa
lahko začnemo z dokazovanjem konvergence sub-martingalov. Ideja: Izbrali si bomo interval [a,b]. Dokazali bomo, da sub-martingal "prečka"
[a,b] samo končno mnogokrat. Definirajmo nekaj količin za sub-martingal (Xn,Fn):
S1=inf{n≥0,
Xn≤a}
T1=inf{n>S1, Xn≥b}
...
Si=inf{n>Ti-1,
Xn≤a}
Ti=inf{n>Si, Xn≥b}
Definiramo U(a,b,N)=max(j: Tj≤N).
Ta slučajna spremenljivka šteje, kolikokrat je Xn "prečkal" interval [a,b] od spodaj navzgor v času do N. Definirajmo še
Si*=Si/\N=min(N,Si) in Ti*=Ti/\N=min(N,Ti).
Si* in Ti* so tudi opcijski časi in po definiciji velja Si*≤Ti*.
LEMA 3.5 (Neenačba za prečkanja): Velja E(U(a,b,N))≤E((XN-a)+)/(b-a)≤
(E|XN|+|a|)/(b-a).
LEMA 3.6 : Naj bo XN sub-martingal in naj velja liminfE(Xn+)<∞,
n->∞. Potem Xn konvergira s.g.
NAZAJ NA KAZALO!
3.2 Karakteristične funkcije
Želimo transformacijo, ki bi bila uporabna za poljubne slučajne spremenljivke in bi imela še kakšno lepo lastnost. Sposodimo si Fourierjevo
transformacijo iz analize in definiramo:
Definicija: Naj bo X slučajna spremenljivka z vrednostmi v R. Njeno KARAKTERISTIČNO FUNKCIJO definiramo kot
ΦX(t)=E(eitx).
Opomba: (i) Če je Z slučajna spremenljivka z vrednostmi v C, razumemo E(Z) po komponentah.
(ii) ΦX
obstaja za vsak t, ker je |eitx|≤1.
(iii) Terminologija je nekoliko nenatančna. V resnici bi morali govoriti o
karakterističnih funkcijah porazdelitve X. Lahko napišemo: ΦX(t)=E(eitx)=∫ReitxμX(dx).
Nekaj primerov karakterističnih funkcij:
Primer1: Naj bo X nenegativna, celoštevilska slučajna spremenljivka, z rodovno funkcijo GX.
Potem je:
Primer2: Poskusimo izračunati ΦX
za X~N(0,1). V načelu je:
Primer3: Naj bo X~Γ(a,λ). Računamo karakteristično funkcijo:
(*)-Utemeljitev zamenjave
integrala in vsote:
Po izreku LDK lahko vedno zamenjamo vrstni red, če je Σ|fn| integrabilna. V našem konkretnem primeru
je fn(x)=(itx)k·xa-1·e-λx/k!. Dobimo:
Σ|fk(x)|=...=xa-1e-λxe|t|·|x|. To je integrabilna funkcija, če je |t|≤λ.
Za poljubne t lahko sklepamo na podlagi holomorfnosti funkcije t->ΦX(t) na pozitivni polravnini, tj. Re(z)>0. Bralec: kako pa
je z injektivnostjo?
IZREK 3.7 : Karakteristična funkcija ΦX natanko določa porazdelitev μX.
Komentar: Če se izkaže, da je ΦXЄL1(R), lahko z majhno spremembo dokaza ugotovimo, da ima X gostoto,
ki je dana z fX(x)=(1/2π)·∫e-itΦX(t)dt.
LEMA 3.8 : (i) Naj bo X slučajna spremenljivka in ΦX njena karakteristična funkcija. Velja:
|ΦX|≤1 in ΦX je enakomerno zvezna na R.
(ii) ΦX(-t)=ΦX(t)* (tj. konjugirano-pišemo
tudi s črto nad izrazom).
(iii) Če sta X in Y neodvisni, je ΦX+Y=ΦX·ΦY.
Primeri: (i) Naj bosta X in Y neodvisni in X~Γ(a,λ), Y~Γ(b,λ). Potem je
Zaradi
enoličnosti je X+Y~Γ(a+b,λ).
(ii) Vzemimo X z Laplaceovo porazdelitvijo, tj. fX(x)=1/2·e-|x|. Izračunajmo:
Iztržili smo naslednje: Če je Y Cauchy-jeva, torej ima gostoto fY(y)=1/(π(1+y2)), je karakteristična funkccija
enaka ΦY(t)=e-|t|.
(iii) Naj bodo X1,...,X4 med sabo neodvisne in Xi~N(0,1)
za vse i. Definirajmo: Y:=X1·X2+X3·X4. Zanima nas porazdelitev Y. Izračunajmo karakteristično
funkcijo produkta X1·X2. Vemo: če sta X,Z neodvisni, je E(f(X,Z)|Z)=ψ(Z), kjer je ψ(Z)=E(f(X,Z)). Pri izračunu se delamo, da je X2 konstanta.
Torej je:
Ker sta X1·X2 in X3·X4 neodvisni in enako porazdeljeni,
je ΦY(t)=ΦX1·X2(t)·ΦX3·X4(t)=
1/(1+t2). To pa je karakteristična funkcija porazdelitve z gostoto fY(y)=(1/2)·e-|y| na R.
(iv) Vemo, da je ΦX(t)=E(eitx)=∫ReitxμX(dx). Kako pa je z
odvedljivostjo ΦX? To je vprašanje o odvajanju integrala s parametrom. Izrek, ki zadošča našim potrebam je naslednji:
IZREK : Funkcija t->∫Rf(x,t)μX(dx) je odvedljiva v t0ЄR,
če velja:
(i) parcialni odvod ∂f/∂t obstaja za tЄ(t0-ε,t0+ε) in za vsak xЄR
(ii) |∂f/∂t(x,t)|≤g(x) za xЄR, tЄ(t0-ε,t0+ε) in gЄL1(μX).
V tem primeru je odvod enak ∫∂f/∂t(x,t)μX(dx).
Opomba: Povsem podobni izreki veljajo za višje odvode. (podrobnosti-predavanja)
Še nekaj sorodnikov karakteristične funkcije:
Definicija: Naj bo X nenegativna slučajna spremenljivka s porazdelitvijo μX. LAPLACEOVO TRANSFORMACIJO definiramo
kot ψ(λ)=E(e-λx)=∫e-λxμX(dx), xЄ[0,∞) in λ≥0.
Dve vprašanji:
(i) Enoličnost?
(ii) Kako je z vsotami neodvisnih slučajnih spremenljivk?
Odgovora:
(i) Funkcija z->E(e-zx)=∫e-zxμX(dx) obstaja za Re(z)≥0. Ta funkcija je zvezna
za Re(z)≥0. Poleg tega je ta funkcija za Re(z)>0 holomorfna. Opazimo, da je ψ(it)=ΦX(t). Skličemo se na izrek
o edinosti iz kompleksne analize: če poznamo ψ(λ) za λЄ(0,∞), poznamo tudi ψ(z)
za Re(z)≥0. Zaradi zveznosti na zaprti polravnini, poznamo ψ tudi na imaginarni osi. Sledi: poznamo karakteristično funkcijo
ΦX in s tem porazdelitev.
(ii) Naj bosta X,Y≥0 in neodvisni. Potem je ψX+Y(λ)=
E(e-λ(x+y))=E(e-λx∙e-λy)=E(e-λx)∙E(e-λy)=
ψX(λ)∙ψY(λ).
Primer: Naj bodo Z1,...,Zn neodvisne in Zi~N(0,1). Definiramo:
W=a12/Z12+...+an2/Zn2. Izračunamo gostoto
a2/Z2 za Z~N(0,1). Označimo T=a2/Z2. Računamo:
Odvajamo in dobimo:
za t>0.
Sestavine:
Vemo, da je Z1/Z2~Cauchy, če sta Z1 in Z2
neodvisni in N(0,1). Torej je E(eitZ1/Z2)=
e-|t|. (podrobnosti-predavanja)
Primer: Pogosto imamo v verjetnosti opravka z vsotami slučajno mnogo slučajnih spremenljivk. Tipično:
X1,X2,... so neodvisne, enako porazdeljene in N je nenegativna, celoštevilska slučajna spremenljivka. Definiramo:
Podobno kot pri rodovnih funkcijah velja:
(i) ΦS(t)=GN(ΦX1(t)).
(ii) Če so
Xi≥0, velja tudi ψS(λ)=GN(ψX1(λ)).
Primer: Recimo, da je N~Po(μ) in so Xi~exp(1). Zanima nas porazdelitev X1+...+XN.
Vemo, da je GN(s)=e-μ(1-s). Računamo:
Sledi:
NAZAJ NA KAZALO!
Večrazsežne karakteristične funkcije
Ideja je vzeta iz analize (Fourierjeva transformacija).
Definicija: Naj bo X slučajni vektor. Njegovo KARAKTERISTIČNO FUNKCIJO definiramo kot ΦX(t)=
E(eitx)=∫RneitxμX(dx).
Vprašanje: Ali ΦX enolično določa μX?
Odgovor: Da! (podrobnosti-predavanja)
Misel: Če imata X in X' enako porazdelitev, imata tudi enako karakteristično funkcijo.
Primer (Slučajni sprehod na Zd): Pijanec začne slučajni sprehod v točki (0,0). Na
vsakem koraku si naključno in neodvisno izbere smer, v kateri se bo premaknil. Pomik na koraku n je slučajni vektor z vrednostmi (1,0),
(-1,0), (0,1) in (0,-1). Kolikšna je verjetnost, da se bo slučajni sprehajalec vrnil v izhodišče? Odgovor je odvisen od dimenzije!
Slika
za d=2:
Označimo z N=število "obiskov" točke 0. Po razmisleku dobimo:
Za d=2 je E(N)=∞. Za d≥3 z istim postopkom dobimo, da je E(N)<∞. Označimo
z ρ verjetnost, da se pijanec vrne v izhodišče. Po vrnitvi se zgodbica "začne znova". Recimo, da je "poskus" oditi iz (0,0) in se NE vrniti.
Posamezni poskusi po vrnitvi v izhodišče so neodvisni. Število obiskov (0,0) bo Geom(1-ρ). Sledi: N~Geom(1-ρ). Vemo,
da je E(N)=∞ za d=2 in E(N)<∞ za d≥3 ter E(N)=1/(1-ρ). Torej je: ρ=1
za d=2 in ρ<1 za d≥3. (podrobnosti-predavanja)
NAZAJ NA KAZALO!
3.3 Konvergenca slučajnih spremenljivk
Poznamo več različnih tipov konvergenc slučajnih spremenljivk. Izbira je odvisna od namena. Potrebovali bomo preprosti neenačbi:
Če je slučajna spremenljivka X≥0, je P(X≥x)≤E(X)/X. To je
neenačba Markova.
Bolj splošno lahko rečemo: če je
Φ:[0,∞)->[0,∞) naraščajoča, je P(X≥x)≤E(Φ(X))/Φ(X).
Poseben primer je neenačba Čebiševa: če je Y slučajna spremenljivka, potem je P(|Y-E(Y)|≥y)≤var(Y)/y2.
V naslednjih definicijah naj bodo vse slučajne spremenljivke definirane na istem verjetnostnem prostoru (Ω,F,P).
Definicija: (i) Zaporedje slučajnih spremenljivk X1,X2,...KONVERGIRA V VERJETNOSTI proti spremenljivki X,
če za vsak ε>0 obstaja nε, tako da za n≥nε
velja P(|X-Xn|>ε)<ε.
Opomba: Ta konvergenca je v teoriji mere znana kot konvergenca po meri.
V definiciji lahko zahtevamo, da je P(|X-Xn|>ε)<δ za n≥nδ,ε, kjer sta ε in
δ predpisana.
Oznaka:
(ii) Zaporedje slučajnih spremenljivk X1,X2,...KONVERGIRA SKORAJ GOTOVO proti spremenljivki X,
če je P({w: limXn(w)=X(w)})=1, ko n->∞.
Opomba: V teoriji mere je to konvergenca skoraj
povsod. Množico v P(...) lahko zapišemo tudi z unijami in preseki.
Oznaka:
(iii) Zaporedje slučajnih spremenljivk
X1,X2,...KONVERGIRA V Lp-NORMI proti spremenljivki X, če velja E(|Xn-X|p)->0, ko
n->∞ in p≥1.
Oznaka:
LEMA 3.11 : Naj bodo X1,X2,...;X slučajne spremenljivke.
(i) Če Xn->X s.g.,
potem Xn->X v verjetnosti.
(ii) Če Xn->X v Lp-normi, potem Xn->X v verjetnosti.
Opomba: To sta edini implikaciji, ki veljata brez dodatnih predpostavk in nobena od implikacij ne velja v obratni smeri.
LEMA 3.12 : Naj bodo X1,X2,...;X slučajne spremenljivke. Velja:
(i) Xn->X
v verjetnosti, če in samo če ima vsako podzaporedje {Xnk} nadaljnje podzaporedje, ki konvergira s.g.
(ii) Če je
f zvezna funkcija, f:R->R in Xn->X v verjetnosti, potem f(Xn)->f(X) v verjetnosti.
Tipično vprašanje pri konvergenci slučajnih spremenljivk je naslednje: Naj bodo X1,X2,... slučajne spremenljivke
in Sn=X1+...+Xn. Kdaj lahko najdemo zaporedji an in bn, da velja
(Sn-an)/bn->Y in konvergenca Є{P,s.g.,Lp,d}?
IZREK 3.13 : Naj bodo X1,X2,... nekorelirane slučajne spremenljivke z matematičnim upanjem
μ=E(Xn) za vse n. Naj bo var(Xn)≤c<∞ za vse n. Naj bo Sn=
X1+...+Xn. Potem velja Sn/n -> μ v verjetnosti, ko n->∞.
Opomba: To je ŠIBKI ZAKON VELIKIH ŠTEVIL.
Primer: Naj bo f:[0,1]->R zvezna (in s tem enakomerno zvezna). Naj bodo I1,I2,...
neodvisne, enako porazdeljene slučajne spremenljivke, Ik~Bernoulli(p). Vemo: var(Ik)=p(1-p)≤1/4 za vse p Є[0,1].
Označimo: Sn=I1+...+In. Vemo: Sn~Bin(n,p). Po izreku vemo, da je Sn/n->p v verjetnosti.
Po Čebiševu velja še več: P(|Sn/n - μ|>δ)≤(var(Sn/n))/δ2≤1/4δ2n.
Naj bo ε>0. Najprej ocenimo:
Za zgoraj izbran ε>0 obstaja δ>0, tako da je |f(x)-f(y)|<ε, če je
|x-y|≤δ. V zgornji oceni izberimo ta δ in dobimo:
Ugotovili smo, da velja E(f(Sn/n))->f(p), ko n->∞, enakomerno v p. Po drugi strani pa je
Sledi: Bn(p)->f(p) enakomerno za pЄ[0,1]. To je
Weierstrassov kriterij-Analiza 1.
IZREK 3.14 : Naj bodo X1,X2,... neodvisne, enako porazdeljene slučajne spremenljivke. Označimo
Sn=X1+...+Xn. Naslednji trditvi sta ekvivalentni:
(i)
(Sn/n - μn)->0 za neko
zaporedje μn.
(ii) x·P(|X1|>x)->0, ko x->∞. V tem primeru lahko vzamemo
μn=E(|X1|·1(|X1|≤n)).
Primer: Kaj so "fair" igre na srečo? Recimo, da igramo isto igro na srečo večkrat. Čisti dobiček v n-ti igri
označimo z Xn. Privzamemo, da so X1,X2,...neodvisne in enako porazdeljene slučajne spremenljivke.
Podprimer: Pri ruleti in stavah na številko je P(X1=-1)=36/37 in P(X1=35)=1/37. Sledi: E(X1)=-1/37.
Igra v tem smislu ni "fair". Za "fair" igro bi moralo biti E(X1)=0.
Za konkretni primer stave na eno številko, bi za "fair"
stavo x moralo veljati: -x·36/37 + 35/37 =0 => x=35/36.
Druga možna interpretacija "fair" stave je naslednja:
Označimo
Sn=X1+...+Xn. Lahko rečemo, da je igra "fair", če je razmerje dobiček/vložek≈1. Bolj
matematično: Označimo stavo za n iger s cn. Dovolimo si, da je stava na igro odvisna od števila iger. Lahko rečemo, da je igra
"fair", če velja Sn/n·cn -> 1, pri čemer lahko tip konvergence še izberemo med {s.g.,P,Lp}.
Primer (Sankt-Petersburški paradoks): Odločimo se igrati n iger. Stava je cn. Ponudnik
meče kovanec, dokler ne dobi grba. Če se to zgodi v n-tem metu, je izplačilo 2n. Kaj je fair stava? Če označimo z Xi dobiček,
je ta enak Xi=2Yi-cn, kjer je Yi~Geom(1/2). Če izračunamo, je E(Xi)=
+∞-cn=+∞. Pristop z matematičnimi upanji NE funkcionira.
Komentar: Osnovno verzijo izreka 3.14 zlahka posplošimo: Naj bodo za vsak n slučajne spremenljivke Xn,1,...,Xn,n
neodvisne. Če velja
potem velja
Primer: Pokažimo, da ta izrek "prime" za Sankt-Persburški paradoks. Definiramo kar Xn,k=Xk
za vse n in an'=bn=n·log2n. (podrobnosti-predavanja)
Dobimo:
Povzemimo, kaj je bilo pomembno pri konvergenci v verjetnosti:
(i) Kaj je definicija?
(ii) Izrek, ki sklepa o konvergenci v
verjetnosti na podlagi s.g. konvergence.
(iii) Ta konvergenca je pogosto dobro tehnično sredstvo.
NAZAJ NA KAZALO!
Skoraj gotova konvergenca
Za slučajne spremenljivke X1,X2,..., ki so neodvisne, enako porazdeljene in velja var(X1)<∞ in E(X1)=0 velja: Sn/n -> 0 v verjetnosti in Sn=X1+...+Xn.
Vemo, da je s.g. konvergenca "močnejša". Ali lahko P poostrimo do s.g.? Odgovor je DA!
IZREK 3.15 : Naj bodo X1,X2,...neodvisne, enako porazdeljene slučajne spremenljivke in Sn=
X1+...+Xn. Naj bo E(X1)=μ in var(X1)=σ2<∞.
Potem Sn/n -> μ s.g.
Komentar: (i) Izrekom s s.g. konvergenco pogosto rečemo KREPKI ZAKONI VELIKIH ŠTEVIL.
(ii) To je formalna potrditev intuitivne motivacije
za definicijo s.g. konvergence.
(iii) Zahteva, da je var(X1)<∞, je odveč. Izrek velja tudi, če
zahtevamo samo E|X1|<∞. Če pa je E|X1|=∞, potem izrek ne velja.
(iv) Obstaja mnogo izrekov tipa s.g. konvergence. Novejši tipi takih izrekov uporabljajo martingale za dokaz konvergence.
NAZAJ NA KAZALO!
3.4 Konvergenca v porazdelitvi
Motivacija: Večinoma so nas bolj zanimale porazdelitve, kot pa slučajne spremenljivke same. Mogoče lahko kaj povemo o porazdelitvi vsot
Sn=X1+...+Xn za neodvisne slučajne spremenljivke X1,X2,...,tudi, če ne znamo
eksplicitno povedati porazdelitve Sn ali je ta komplicirana. Zato potrebujemo koncept "podobnosti" ali "bližine" porazdelitev
in koncept konvergence. Porazdelitve so mere. Torej potrebujemo koncept konvergence mer. Ideja je "podobnost na otip". Mero "otipamo" tako,
da integriramo neko funkcijo.
Ideja: Poskusimo definirati, da μn->μ, če
∫f(x)μn(dx)->∫f(x)μ(dx) za nek nabor funkcij f. Kaj je pravi nabor? Lahko vzamemo Borelove funkcije z |f|≤1. Dobimo konvergenco v
totalni variaciji. Ali bi moralo veljati, da δ1/n->δ0? Velja
||δ1/n-δ0||TV=1 (TV=totalna
variacija). Razlog, zakaj to ni dobro, je ta, da so Borelove funkcije
preveč "oglate". V verjetnosti definiramo:
Definicija: (i) Če za vsako omejeno, zvezno funkcijo f:(M,d)->R velja ∫Mf(x)μn(dx)->∫Mf(x)μ(dx), ko
n->∞, potem pravimo, da VERJETNOSTNE MERE μn ŠIBKO KONVERGIRAJO proti verjetnostni meri μ.
Oznaka:
(ii) Slučajne spremenljivke X1,X2,... z
vrednostmi v (M,d) KONVERGIRAJO V PORAZDELITVI proti X, če za vsako
omejeno, zvezno funkcijo f:(M,d)->R velja E(f(Xn))->E(f(X)), ko n->∞.
Oznaka:
Komentar: (i) Če je (M,d) poljski prostor (poln, separabilen) in so μ mere, ki so "združljive" s topologijo, potem lahko definiramo
metriko Prohorova z ρ(μ,ν)=inf{ε>0:μ(F)≤ν(Fε)+ε, F zaprta}, pri čemer je
Fε ε-okolica, tj. Fε={y: d(y,F)<ε}.
(ii) V resnici govorimo o konvergenci porazdelitev,
ne slučajnih spremenljivk samih.
(iii) Konvergenco in metriko potrebujemo zato, da lahko aproksimiramo komplicirane porazdelitve.
Opomba: Zakaj smo za "otipavanje" mer izbrali zvezne funkcije? Zato, ker bi otipavanje z Borelovimi funkcijami zahtevalo preveč
od konvergence. Že pred definicijo smo videli, da v primeru Borelove funkcije dobimo konvergenco v totalni variaciji. Sedaj potrebujemo
nekaj tehničnih lem.
LEMA 3.16 : Naslednje trditve so ekvivalentne:
(i) Xn=>X v porazdelitvi
(ii)
limsupP(XnЄF)≤P(XЄF) za zaprte F in n->∞
(iii)
liminfP(XnЄG)≥P(XЄG) za odprte G in n->∞.
Komentarji in posledice:
(i) Iz dokaza leme je razvidno, da se lahko pri definiciji omejimo na enakomerno zvezne funkcije f.
(ii) Naj bodo X1, X2,... slučajne spremenljivke z vrednostmi v R. Izjava Xn=>X v porazdelitvi je
ekvivalentna izjavi FXn(x)->FX(x) za vse x, v katerih je FX zvezna. To je pravzaprav stara
definicija zveznosti.
Primer: Naj bodo X1,X2,... neodvisne slučajne spremenljivke in Xi~U(0,1)
za i≥1. Definiramo Mn=max(X1,...,Xn). Oglejmo si zaporedje n·(1-Mn). Računamo za
X≥0:
Ko gre n->∞, dobimo limP(n·(1-Mn)≤X)=1-e-x. Povzemimo:
Na desni
je porazdelitvena funkcija slučajne spremenljivke X~exp(1). Konvergenca velja za vse XЄR.
Zapišemo:
Komentar: Konvergenca FXn je ena od glavnih metod za dokazovanje konvergence v porazdelitvi.
LEMA 3.17 : Naj bodo X1,X2,...;X in Y1,Y2,... slučajne spremenljivke.
Naj velja: Xn->X v porazdelitvi in Yn->0 v verjetnosti. Potem velja: Xn+Yn->X v porazdelitvi.
Opomba: Če bi imeli Yn->0 v porazdelitvi namesto v verjetnosti, potem lema ne bi veljala!
NAZAJ NA KAZALO!
Uporaba karakterističnih funkcij
IZREK 3.18 (P.Levy): Naj bodo X1,X2,... slučajne spremenljivke z vrednostmi na R.
Naj bodo ΦX1,ΦX2,... njihove karakteristične funkcije. Če velja
ΦXn->g(t) po točkah za vsak t in je g zvezna v t=0, potem je g karakteristična funkcija neke slučajne spremenljivke X
in velja Xn->X v porazdelitvi.
Komentar: Zakaj zveznost v t=0? To je gotovo potreben pogoj. Če Xn->X v porazdelitvi in opazimo, da je x->eitx
zvezna, sledi, da mora biti tudi ΦX zvezna v t=0 (kar tako ali tako vemo). Prva res tehtna uporaba je naslednja:
IZREK 3.19 (CENTRALNO LIMITNI IZREK): Naj bodo X1,X2,... neodvisne, enako porazdeljene
slučajne spremenljivke z E(X1)=μ, var(X1)=σ2 in naj velja E|X1|3<∞.
Označimo Sn=X1+...+Xn. Velja:
Definicija: Družina verjetnostnih mer {μi} je TESNA (beri OMEJENA), če za vsak ε>0 obstaja kompaktna
množica Kε, da velja μi(Kε)>1-ε za vse i.
IZREK 3.20: Naj bo {μk} tesno zaporedje verjetnostnih mer. Tako zaporedje ima konvergentno podzaporedje
in s tem tudi stekališče.
LEMA 3.21 : Če za zaporedje mer μ1,μ2,... velja Φk(t)->g(t) po
točkah, ko n->∞ in je g zvezna v t=0, potem je zaporedje tesno.
Bistvo dokaza Levy-jevega izreka: Ker Φn->g in je g zvezna v t=0, je {μk} tesno. Kot tako ima stekališče
po izreku 3.20. Konvergenca Φn pa pomeni, da je stekališče največ eno. S tem je izrek dokazan.
Definicija: TRIKOTNA SHEMA slučajnih spremenljivk je nabor Xnk, n≥1, 1≤k≤rn.
Posplošitev centralnega limitnega izreka je:
IZREK 3.22 (Lindeberg-Fellerjev izrek): Naj bo {Xnk} trikotna shema slučajne spremenljivke Z in
rn->∞, naraščajoče zaporedje. Naj velja:
(i) Za vsak n so Xn1,...,Xnrn
neodvisne slučajne spremenljivke.
(ii) E(Xnk)=0 za vse n,k in
sn2=var(Xn1)+...+var(Xnrn)<∞.
(iii) Za vsak ε>0
naj velja Lindeberg-Fellerjev pogoj:
Označimo: Sn=(Xn1+...+Xnrn)/sn. Velja
Sn->Z~N(0,1).
Komentar: (i) Ne zahtevamo, da so Xn1,Xn2,... enako porazdeljene. Ohranimo pa predpostavko o neodvisnosti.
(ii) Kaj pove Lindeberg-Fellerjev pogoj? V grobem pove, da novena od slučajnih spremenljivk Xn1,Xn2,... ni bistveno "večja"
od ostalih.
Primer: V kitajsko restavracijo prihajajo po vrsti naravna števila. V restavraciji je neskončno miz, ki so
oštevilčene z 1,2,3,...Dogaja se naslednje:
(i) 1 se usede za mizo 1
(ii)
ko pride k, si ogleda mize in sede levo od j z verjetnostjo 1/(θ+k-1) ali pa se
usede za naslednjo še nezasedeno mizo z verjetnostjo θ/(θ+k-1). k se obnaša
neodvisno od tega, kaj so naredili 1,2,...,k-1. Slika:
V
resnici smo konstruirali slučajno permutacijo π=(13)(265)(4)(7). Če bi šli do n, bi dobili slučajno permutacijo n števil. Naj bo
Sn število zasedenih miz po n gostih. Kaj znamo povedati o Sn za velike n? Definirajmo
Zapišemo lahko:
Sn=ξ1+...+ξn. Iz besedila naloge sledi, da so ξ1,ξ2,... neodvisne in da je
ξi~Bernoulli(θ/(θ+i-1)).
Komentar: Za θ>0 in fiksen n rečemo, da ima Sn Poisson-Dirichletovo(θ)
porazdelitev.
Rodovna funkcija Sn je oblike
Omejimo se na primer, ko je θ=1. V tem primeru vsako permutacijo dobimo z
verjetnostjo 1/n! in rodovna funkcija je
P(Sn=k) je koeficient pri sk v zgornji rodovni funkciji. Vemo, da so ti
koeficienti P(Sn=k)=Sn(k)/n!, kjer je Sn(k) Stirlingovo število prve vrste. Za
Sn(k) ni uporabne eksplicitne oblike. Za aproksimacije se zatečemo k Lindeberg-Fellerju. Velja:
Sn=ξ1+...+ξn, kjer so ξi neodvisne, vendar ne enako porazdeljene slučajne spremenljivke.
Preveriti moramo predpostavke Lindeberg-Fellerjevega izreka. (podrobnosti-predavanja)
Dobimo:
LEMA 3.23 : Naj bodo Z1,...,Zn in W1,...,Wn
kompleksna števila, po absolutni vrednosti manjša od θ. Velja:
Posledica: Za kompleksna števila Cn,C iz Cn->C, sledi (1+Cn/n)->eC, ko n->∞.
LEMA 3.24 : Za xЄR velja
Opomba: Zadnje leme so samo sredstvo za pomoč pri dokazu Lindeberg-Fellerjevega izreka!
Komentar: (i) V prvi verziji centralno limitnega izreka smo predpostavljali
E|X1|3<∞. Če vzamemo
kar Xnk=Xk v Lindeberg-Fellerjevem izreku, vidimo, da predpostavka ni potrebna. Dovolj je predpostavljati
E(X1)=μ in var(X1)=σ2<∞.
(ii) Levy-jev izrek velja tudi
v več dimenzijah.
NAZAJ NA KAZALO!
KONEC