Valószínűségszámítás és statisztika

Fazekas, István

Új Széchenyi Terv logó.

Debreceni Egyetem

Kelet-Magyarországi Informatika Tananyag Tárház

A tananyagfejlesztés az Európai Unió támogatásával és az Európai Szociális Alap társfinanszírozásával a TÁMOP-4.1.2-08/1/A-2009-0046 számú Kelet-Magyarországi Informatika Tananyag Tárház projekt keretében valósult meg.

Kivonat

Nemzeti Fejlesztési Ügynökség http://ujszechenyiterv.gov.hu/ 06 40 638-638

Lektor

Csiszár Villő

ELTE, adjunktus


Tartalom

1. A valószínűségszámítás alapfogalmai
1.1. A valószínűség
1.1.1. Az eseménytér
1.1.2. Műveletek események között
1.1.3. A valószínűség fogalmának statisztikai jellegű megvilágítása
1.1.4. A valószínűség axiómái
1.1.5. A valószínűség tulajdonságai
1.1.6. Véges valószínűségi mezők
1.1.7. A klasszikus valószínűségi mező
1.2. Halmazalgebrák és -algebrák
1.2.1. A valószínűség -additivitása
1.2.2. A valószínűség folytonossága
1.2.3. Megszámlálható valószínűségi mezők
1.2.4. A valószínűség geometriai kiszámítási módja
1.3. A feltételes valószínűség
1.3.1. A feltételes valószínűség fogalma
1.3.2. A teljes valószínűség tétele
1.3.3. Bayes tétele
1.4. Események függetlensége
1.4.1. Két esemény függetlensége
1.4.2. Több esemény függetlensége
1.4.3. A valószínűség geometriai kiszámítási módja és a függetlenség
2. Diszkrét valószínűségi változók
2.1. Véletlentől függő mennyiségek
2.1.1. Mennyit nyerünk?
2.1.2. Valószínűségi változók eloszlása
2.1.3. Együttes eloszlások
2.1.4. Függetlenség
2.1.5. A konvolúció
2.2. Diszkrét valószínűségi változók várható értéke
2.2.1. A várható nyeremény
2.2.2. A várható érték és a függetlenség
2.3. A szórás
2.3.1. Az ingadozás mértéke
2.3.2. A szórás tulajdonságai
2.3.3. A Csebisev-egyenlőtlenség
2.4. A korrelációs együttható
2.4.1. A kovariancia
2.4.2. A korrelációs együttható
2.4.3. Valószínűségi vektorváltozók
2.4.4. A legkisebb négyzetes predikció
2.5. Nevezetes diszkrét eloszlások
2.5.1. A hipergeometrikus eloszlás
2.5.2. A polihipergeometrikus eloszlás
2.5.3. A binomiális eloszlás
2.5.4. A binomiális eloszlás további tulajdonságai
2.5.5. A polinomiális eloszlás
2.5.6. A negatív binomiális eloszlás
2.5.7. A Poisson-eloszlás
3. Valószínűségi változók
3.1. Valószínűségi változók, eloszlások, eloszlásfüggvények
3.1.1. A valószínűségi változó fogalma
3.1.2. Eloszlások
3.1.3. Eloszlásfüggvények
3.1.4. Kvantilisek
3.2. Sűrűségfüggvények
3.2.1. A sűrűségfüggvény fogalma
3.2.2. A normális eloszlás
3.2.3. Valószínűségi változók függvényei
3.3. A várható érték és a szórás
3.3.1. A várható érték definíciója
3.3.2. Momentumok
3.3.3. A várható érték tulajdonságai
3.3.4. A szórás
3.4. Valószínűségi változók együttes eloszlása
3.4.1. Együttes eloszlásfüggvények
3.4.2. Együttes sűrűségfüggvények
3.4.3. A függetlenség
3.4.4. A kovariancia
3.5. Valószínűségi vektorváltozók
3.5.1. Többdimenziós eloszlások
3.5.2. A várható érték vektor és a szórásmátrix
3.5.3. A többdimenziós normális eloszlás
3.5.4. A konvolúció
3.6. A nagy számok törvényei
3.6.1. A Markov- és a Csebisev-egyenlőtlenség
3.6.2. A nagy számok gyenge törvényei
3.6.3. A nagy számok Bernoulli-féle törvénye
3.6.4. A nagy számok erős törvényei
3.7. A központi határeloszlás-tétel
3.7.1. A határeloszlás-tétel lokális alakja Bernoulli-féle kísérletsorozatra
3.7.2. A határeloszlás-tétel integrál alakja Bernoulli-féle kísérletsorozatra
3.7.3. Valószínűségeloszlások konvergenciája
3.7.4. A központi határeloszlás-tétel az általános esetben
3.7.5. A központi határeloszlás-tétel lokális alakja
3.7.6. A központi határeloszlás-tétel szemléltetése
4. Nevezetes abszolút folytonos eloszlások
4.1. Az egyenletes eloszlás
4.1.1. Az egyenletes eloszlás jelentése
4.1.2. Az egyenletes eloszlás jellemző mennyiségei
4.1.3. A többdimenziós egyenletes eloszlás
4.2. Az exponenciális eloszlás
4.2.1. Az exponenciális eloszlás definíciója
4.2.2. Az exponenciális eloszlás jellemző mennyiségei
4.2.3. Az exponenciális eloszlás tulajdonságai
4.2.4. A Laplace-eloszlás
4.3. A normális eloszlás
4.3.1. A normális eloszlás definíciója
4.3.2. A standard normális eloszlás
4.3.3. A normális eloszlás jellemzői
4.4. A többdimenziós normális eloszlás
4.4.1. A többdimenziós standard normális eloszlás
4.4.2. A többdimenziós normális eloszlás általános alakja
4.4.3. A többdimenziós normális eloszlás szemléltése
4.4.4. A többdimenziós normális eloszlás tulajdonságai
4.5. A normális eloszlásból származó eloszlások
4.5.1. A gamma-függvény
4.5.2. A khi-négyzet eloszlás
4.5.3. A Student-eloszlás
4.5.4. Az F-eloszlás
5. A statisztika alapfogalmai
5.1. A minta
5.1.1. A minta és a minta realizáció
5.1.2. A statisztikai mező
5.1.3. Az empirikus eloszlásfüggvény
5.1.4. Hisztogramok
5.2. Statisztikák
5.2.1. Az empirikus közép
5.2.2. Az empirikus szórásnégyzet
5.2.3. A statisztika fogalma
5.2.4. Az empirikus korrelációs együttható
5.3. Statisztikai adatok áttekintése
5.3.1. Az adatok elemzésének lépései
5.3.2. A minta numerikus jellemzői
5.3.3. A minta középértékének és szóródásának leírása
5.3.4. A minta eloszlásának leírása
5.3.5. A minta grafikus jellemzői
5.3.6. Diagramok
5.3.7. Boxdiagram
6. Statisztikai eljárások
6.1. Statisztikai becslések
6.1.1. A maximum-likelihood-becslés
6.1.2. Konfidencia intervallumok
6.2. Paraméteres próbák
6.2.1. -próba.
6.2.2. Elfogadási és kritikus tartomány
6.2.3. Kétmintás -próba
6.2.4. Próbák konstrukciója
6.2.5. Egymintás -próba
6.3. Khi-négyzet próbák
6.3.1. Tiszta illeszkedésvizsgálat
6.3.2. Az illeszkedésvizsgálat végrehajtása
6.3.3. Becsléses illeszkedésvizsgálat
6.3.4. Függetlenségvizsgálat
6.4. Szórásanalízis, regresszióanalízis
6.4.1. Szórásanalízis
6.4.2. Regresszióanalízis
7. Appendix
7.1. Kombinatorika
7.2. Sorozatok, sorok, határértékek
7.3. Differenciálszámítás
7.4. Integrálszámítás
7.5. Vektorok és mátrixok
7.6. Megoldások
7.6.1. 1. fejezet
7.6.2. 2. fejezet
7.6.3. 3. fejezet
7.6.4. 4. fejezet
7.6.5. 5. fejezet
7.6.6. 6. fejezet
7.7. Táblázatok
Irodalomjegyzék

Az ábrák listája

1.1. Műveletek és relációk események között
1.2. Fej-dobások relatív gyakorisága
1.3. Az Az a szélességű sáv az 1.3. példában szélességű sáv az 1.3. példában
1.4. Teljes eseményrendszer
1.5. A kedvező terület az 1.15. példában
1.6. A kedvező térfogat az 1.16. példában
2.1. A hipergeometrikus eloszlás A hipergeometrikus eloszlás N=20 , M=12 és n=6 esetén, A hipergeometrikus eloszlás N=20 , M=12 és n=6 esetén és A hipergeometrikus eloszlás N=20 , M=12 és n=6 esetén esetén
2.2. p=0.25 , n=10 esetén a binomiális eloszlás, p=0.25 , n=10 esetén a binomiális eloszlás esetén a binomiális eloszlás
2.3. \lambda=2 paraméterű Poisson-eloszlás paraméterű Poisson-eloszlás
3.1. A A p=1/2 , n=4 paraméterű binomiális eloszlás eloszlásfüggvénye, A p=1/2 , n=4 paraméterű binomiális eloszlás eloszlásfüggvénye paraméterű binomiális eloszlás eloszlásfüggvénye
3.2. Eloszlásfüggvény és inverze
3.3. A Cauchy-eloszlás kvartilisei és mediánja
3.4. A Cauchy-eloszlás sűrűségfüggvénye
3.5. Kétdimenziós exponenciális eloszlásfüggvény
3.6. A nagy számok Bernoulli-féle törvénye
3.7. Sztochasztikus konvergencia a 3.23. példában
3.8. Integrál közelítő kiszámítása
3.9. A binomiális eloszlás közelítése normálissal
3.10. A binomiális eloszlásfüggvény közelítése normálissal
3.11. Eloszlásfüggvények konvergenciája
3.12. A standardizált bolyongás
3.13. A standardizált bolyongás ismétléseinek eredménye
4.1. Az egyenletes eloszlás eloszlásfüggvénye
4.2. Az egyenletes eloszlás sűrűségfüggvénye
4.3. 2, ill. 3 egyenletes eloszlás konvolúciója
4.4. Az exponenciális eloszlásfüggvény
4.5. Az exponenciális sűrűségfüggvény
4.6. Normális sűrűségfüggvények különböző szórásokra
4.7. Hisztogram és normális sűrűségfüggvény
4.8. A standard normális sűrűségfüggvény
4.9. A standard normális eloszlásfüggvény
4.10. A kétdimenziós normális sűrűségfüggvény
4.11. Koncentráció ellipszisek
4.12. Koncentráció ellipszoidok
4.13. A khi-négyzet eloszlás sűrűségfüggvénye
4.14. \chi_{30}^{2} és \mathcal{N}(30,60) sűrűségfüggvényeés \chi_{30}^{2} és \mathcal{N}(30,60) sűrűségfüggvénye sűrűségfüggvénye
4.15. \chi_{20}^{2} és \chi_{20}(5) sűrűségfüggvényeés \chi_{20}^{2} és \chi_{20}(5) sűrűségfüggvénye sűrűségfüggvénye
4.16. A Student-eloszlás sűrűségfüggvénye
4.17. Az Az F -eloszlás sűrűségfüggvénye-eloszlás sűrűségfüggvénye
5.1. 5 elemű minta empirikus eloszlásfüggvénye
5.2. 50 elemű minta empirikus eloszlásfüggvénye és az elméleti eloszlásfüggvény
5.3. Durva beosztású hisztogram
5.4. Megfelelő beosztású hisztogram és az elméleti sűrűségfüggvény
5.5. Túl sűrű beosztású hisztogram
5.6. Valószínűségek és relatív gyakoriságok a binomiális eloszlás esetén
5.7. A 20, 40, 60 és 80 százalékos kvantilisek
5.8. A gyakoriságok kördiagramja
5.9. A gyakoriságok oszlopdiagramja
5.10. Boxdiagram
5.11. Standard normális eloszlás esetén a kiugró és az extrém értékek valószínűsége
6.1. A standard normális sűrűségfüggvény és A standard normális sűrűségfüggvény és u_{\alpha/2} kapcsolata kapcsolata
6.2. A kritikus érték és a standard normális sűrűségfüggvény
7.1. Paraboloidok és nyeregfelület
7.2. Az Az \boldsymbol{y} vektor merőleges vetülete a V altérre vektor merőleges vetülete a Az \boldsymbol{y} vektor merőleges vetülete a V altérre altérre
7.3. A standard normális eloszlás táblázata
7.4. A standard normális eloszlás táblázata
7.5. A khi-négyzet próba táblázata
7.6. Az Az F -próba táblázata-próba táblázata
7.7. Az Az F -próba táblázata-próba táblázata
7.8. Az Az F -próba táblázata-próba táblázata
7.9. Az Az t -próba táblázata-próba táblázata
7.10. A binomiális eloszlás táblázata
7.11. A binomiális eloszlás táblázata
7.12. A binomiális eloszlás táblázata
7.13. A binomiális eloszlás táblázata
7.14. A Poisson-eloszlás táblázata
7.15. A Poisson-eloszlás táblázata
7.16. A Poisson-eloszlás táblázata
7.17. A Poisson-eloszlás táblázata

1. fejezet - A valószínűségszámítás alapfogalmai

1.1. A valószínűség

A valószínűségszámítás témája: a véletlen tömegjelenségekre vonatkozó törvényszerűségek megállapítása. Véletlen jelenség az, aminek a kimenetelét a tekintetbe vett (rendelkezésre álló) feltételek nem határozzák meg egyértelműen. Tömegjelenségen pedig olyan jelenséget értünk, amely nagy számban megy végbe egyszerre (pl. atomi bomlás), vagy sokszor megismételhető (pl. szerencsejátékok). A levonható törvényszerűségek statisztikai jellegűek, azaz nagy számú végrehajtás során átlagosan érvényes törvények.

A véletlen jelenségek leírására sztochasztikus modelleket használunk. Ilyen modellek esetén az adott feltételrendszer nem határozza meg egyértelműen, hogy egy esemény bekövetkezik-e, vagy sem. Ezzel ellentétben, az ún. determinisztikus modellek esetén a tekintetbe vett feltételrendszer egyértelműen meghatározza, hogy egy adott esemény bekövetkezik-e vagy sem.

1.1.1. Az eseménytér

Tekintsünk egy véletlen kísérletet. A kísérlet lehetséges kimeneteleit elemi eseményeknek nevezzük. Az elemi esemény karakterisztikus tulajdonsága, hogy csak egyféleképp következhet be. Az elemi eseményeket szimbólumokkal jelöljük. Az adott kísérlethez tartozó összes elemi esemény halmazát eseménytérnek (mintatérnek) nevezzük és -val jelöljük. Az elemi eseményekből álló halmazokat (azaz részhalmazait) eseményeknek nevezzük. Az egyes eseményeket betűkkel, míg az összes esemény halmazát -fel jelöljük.

1.1. Példa. (1) Dobjunk fel egy dobókockát. Ennek a kísérletnek 6 lehetséges kimenetele van, így az elemi események: . Az eseménytér . Jelentse azt az eseményt, hogy párosat dobtunk, azt, hogy 3-nál nagyobbat. Ekkor

(2) Húzzunk egy kártyát egy 32 lapos pakliból. Ekkor egy 32 elemű halmaz. Jelölje azt az eseményt, hogy pirosat húztunk, azt, hogy 7-est húztunk. Ekkor

(Itt a piros hetest szimbolizálja, )

(3) Dobjunk fel egy érmét kétszer egymás után. Itt , ahol jelöli, hogy az első dobás írás, a második fej,

(4) Dobjunk egy pontot véletlenszerűen a intervallumra. Ekkor . Jelölje , hogy a pont a -re esik, , hogy -re, , hogy -ra, . Ekkor

1.1.2. Műveletek események között

Eseményekből a szokásos logikai műveletek segítségével alkothatunk új eseményeket. Mivel az események tulajdonképpen halmazok (elemi események halmazai), így a logikai műveletek és a megfelelő halmazelméleti műveletek közötti kapcsolat nyilvánvaló.

Az és esemény összegén azt az eseményt értjük, amely akkor következik be, ha vagy , vagy , vagy mindkettő bekövetkezik. Nyilván a halmazelméleti unió műveletét használva. Tetszőleges (véges vagy végtelen) sok esemény összege olyan esemény, mely akkor következik be, ha az összeadandók valamelyike bekövetkezik.

Az és esemény szorzatán azt az eseményt értjük, mely akkor következik be, ha mind , mind bekövetkezik. Nyilván . Tetszőleges sok esemény szorzata az az esemény, amely akkor következik be, ha a tényezők mindegyike bekövetkezik.

Az esemény ellentettjén azt az eseményt értjük, mely akkor következik be, ha nem következik be. nyilván -nak -ra vonatkozó komplementere.

Szokás még használni két esemény különbségét: akkor következik be, ha bekövetkezik, de nem. és szimmetrikus differenciája: akkor következik be, ha és közül pontosan egy következik be.

1.1. ábra - Műveletek és relációk események között

Műveletek és relációk események között

1.1. Feladat. (1) Igazoljuk, hogy a szorzás és az összeadás kommutatív, asszociatív és idempotens művelet. Igazoljuk a kétféle disztributív törvényt is! Bizonyítsuk be, hogy .

(2) Igazoljuk a de Morgan-féle azonosságokat:

Magyarázzuk ezt a két azonosságot események nyelvén! Írjuk fel és igazoljuk a de Morgan azonosságokat kettő helyett tetszőleges sok eseményre!

Két kitüntetett esemény van. A biztos esemény, amely mindig bekövetkezik; ez nyilván . A lehetetlen esemény, amely soha sem következik be; ez nyilván (az üres halmaz).

1.2. Feladat. Igazoljuk, hogy , , továbbá bármely eseményre.

1.1. Megjegyzés. Azt mondjuk, hogy és kizárja egymást, ha egyszerre nem következhetnek be. Ez pont azt jelenti, hogy és diszjunkt halmazok: . Ha bekövetkezéskor mindig bekövetkezik, akkor azt modjuk, hogy maga után vonja -t. Ez halmazok nyelvén pontosan azt jelenti, hogy .

A továbbiakban a és az ill. a és a műveleti jeleket egymás szinonimájaként fogjuk használni (ezek a szakirodalomban általában keverednek).

1.2. Példa. Az 1.1 példákban bevezetett eseményeket használjuk.

(1) , azaz háromnál nagyobb páros dobás.

(2) , azaz piros 7-est húzunk; pedig azt jelenti, hogy vagy pirosat, vagy 7-est húzunk.

(3) Ha jelöli azt, hogy elsőre írást, azt, hogy másodikra fejet dobunk, akkor .

(4) Az események egymást páronként kizárják és .

1.1.3. A valószínűség fogalmának statisztikai jellegű megvilágítása

Dobjunk fel egy szabályos érmét egymás után sokszor, és jegyezzük fel a kapott fej-írás sorozatot. Például az sorozatot kaphatjuk. Ha dobásból fejet kapunk, akkor -t a fej dobások gyakoriságának, míg -et a fej dobások relatív gyakoriságának nevezzük. A fenti példában a relatív gyakoriságok sorozata: , , , , , , , , Az így kapott sorozat nem ,,szabályos” sorozat, a hagyományos matematikai értelemben (egyelőre) nem állíthatjuk róla, hogy konvergens. Csupán annyi látható, hogy ,,szabálytalan”, ,,véletlen ingadozásokat” mutató sorozat, és a kísérlet újabb végrehajtásakor egy másik ,,szabálytalan” sorozat jön ki. Csupán annyit remélhetünk, hogy valamilyen homályos értelemben 1/2 körül ingadozik (lévén az érme szabályos). A ténylegesen elvégzett kísérletek ezt igazolják is (pl. Buffon 4040 dobásból 2048-szor kapott fejet, míg Pearson 24000 dobásból 0,5005 relatív gyakoriságot kapott).

Figyeljük meg az alábbi, ténylegesen elvégzett (nem számítógépen szimulált) 100 hosszúságú dobássorozat lefolyását!

Sorszám

1

2

3

4

5

6

100

Dobás

F

I

F

I

I

F

F

Fej gyak.

1

1

2

2

2

3

51

Fej rel. gyak.

1

0.5

0.67

0.5

0.4

0.5

0.51

Ábrázoljuk a relatív gyakoriságok grafikonját! Az eredmény a 1.2. ábrán látható.

1.2. ábra - Fej-dobások relatív gyakorisága

Fej-dobások relatív gyakorisága

Megjegyezzük, hogy a fej-írás sorozatban hosszabb homogén blokkok (azaz tiszta F vagy tiszta I részek) fordulhatnak elő, mint azt a laikusok feltételezik.

A jelenségek egy részénél a relatív gyakoriság stabilitást mutat. Pontosabban fogalmazva, tekintsünk egy kísérletet, és ehhez kapcsolódva egy eseményt. Hajtsuk végre a kísérletet -szer egymástól függetlenül, azonos körülmények között. Jelölje az bekövetkezései számát. Ha a relatív gyakoriság nagy esetén egy fix szám körül ingadozik, akkor ezt az -ra jellemző számot -val jelöljük és valószínűségének nevezzük.

A napjainkban általánosan elfogadott (Kolmogorov-féle) elmélet a relatív gyakoriságokra vonatkozó fenti heurisztikus gondolatmenetből csupán a valószínűségre vonatkozó néhány egyszerű következményt tart meg, ezeket axiómaként tekinti, és erre épít fel egy konzekvens matematikai elméletet.

1.1.4. A valószínűség axiómái

A relatív gyakoriság mindig nemnegatív, így

A biztos esemény mindig bekövetkezik: , így

Ha és egymást kizáró események, akkor . Ezért

alapján

ha és egymást kizáró események.

Az eseményeken értelmezett 1.1-1.3 tulajdonságokkal rendelkező függvényt nevezzük valószínűségnek. Tehát nem a valószínűség ,,fizikai mibenlétét” határozzuk meg, csupán a statisztikai szemléletmódból eredő néhány egyszerű tulajdonságot fogadunk el axiómaként.

Az eseményteret, az események halmazát és a valószínűséget együttesen valószínűségi mezőnek fogjuk nevezni. A pontos definíciót a 2. fejezetben fogjuk csak megadni.

1.1.5. A valószínűség tulajdonságai

1.2. Tétel. Ha páronként kizáró események, akkor

Bizonyítás. Alkalmazzuk az 1.3 formulát.

Az ekvivalens 1.3 és 1.4 azonosságokat a valószínűség (végesen) additív tulajdonságának nevezzük.

1.3. Feladat. Legyen és két tetszőleges esemény. Az 1.1-1.3 axiómákból vezessük le az alábbiakat!

A feladatok megoldásához úgy is jó útmutatót kaphatunk, ha az eseményeket Venn-diagrammal szemléltetjük, a valószínűségüket a területükként fogjuk fel, miközben az egész területét 1-nek választjuk.

1.1.6. Véges valószínűségi mezők

A fenti 1.1-1.3 axiómák elegendőek olyan véletlen kísérletek leírására, melyeknek csak véges sok kimenetelük van. Tegyük fel tehát, hogy a kísérlet kimenetelei (az elemi események) száma , azaz

Jelölje az elemi esemény valószínűségét: , . Mivel a valószínűség additív, így

Tehát a számok összege 1. Továbbá

Ezek alapján véges valószínűségi mezők a következőképp írhatók le. Ha az elemi események száma , akkor meg kell adni db nemnegatív, 1 összegű számot (az elemi események valószínűségeit): . Egy esemény valószínűségét pedig úgy számítjuk ki, hogy az -t alkotó elemi események valószínűségeit összeadjuk.

1.1.7. A klasszikus valószínűségi mező

Egy szabályos érme, ill. kocka feldobásakor a lehetséges kimenetelek egyforma valószínűségűek. Számos olyan véletlen kísérlet van (pl. a szerencsejátékok esetén), ahol a lehetséges kimenetelek száma véges, és a kimenetelek egyforma esélyűek (pl. szimmetria okokból). Ekkor az elemi események valószínűségeire , és az 1.6 képlet alapján

Itt jelenti a lehetséges kimentelek számát (azaz az összes elemi esemény számát), míg az számára kedvező kimenetelek számát (vagyis az -ban levő elemi események számát).

Az 1.7 képlet a valószínűség klasszikus kiszámítási módja. Kezdetben ezt tekintették a valószínűség definíciójának. Bár 1.7 számos esetben alkalmazható, általános definícióként nem használható.

1.3. Példa. Az 1.1 és 1.2 példák folytatása.

(1) Egy szabályos kocka feldobásakor minden elemi esemény valószínűsége 1/6. A páros dobás valószínűsége .

(2) Egy kártya kihúzásának valószínűsége 1/32. A piros húzás valószínűsége .

(3) Két érme feldobásakor (vagy, ami ugyanaz, egy érme kétszeri feldobásakor) mind a 4 elemi esemény 1/4 valószínűségű. Felhívjuk a figyelmet, hogy az és az ,,egybemosása” hibához vezet. A kísérlet tényleges végrehajtása azt igazolja, hogy a kísérlet három egyenlően valószínű eseménnyel (nevezetesen ,,két fej”, ,,két írás” és ,,egy fej és egy írás”) való leírása ellentmond a tapasztalatoknak.

(4) Egy pont [0,1] intervallumra történő dobása nyilván nem írható le véges valószínűségi mezővel.

1.3. Megjegyzés. A valószínűség monotonitása:

Az ellentett esemény valószínűsége:

Gyakorlatok

  1. Keressünk egyszerű kifejezéseket az alábbi eseményekre:

  2. Legyenek , és tetszőleges események. Az események közötti műveletekkel fejezzük ki, hogy , és közül a) mindhárom bekövetkezik; b) legalább kettő bekövetkezik; c) legalább egy bekövetkezik; d) egy sem következik be; e) legfeljebb kettő következik be.

  3. Bizonyítsuk be, hogy tetszőleges eseményekre fennáll, hogy

    ahol és ezen utóbbi összegzés az számok -adrendű kombinációira terjed ki.

  4. Bizonyítsuk be az alábbi összefüggéseket, és szemléltessük őket Venn-diagram segítségével!

    1. Ha , akkor . (A valószínűség monotonitása.)

    2. . (Ezt leggyakrabban alakban használjuk.)

    3. .

  5. Hatszor feldobunk egy dobókockát. a) Mennyi a valószínűsége, hogy minden dobás páros? b) Mennyi a valószínűsége, hogy legalább egy 6-ost dobunk?

  6. Véletlenszerűen választva egy legfeljebb ötjegyű számot, mennyi a valószínűsége, hogy mind az öt jegy különböző? (A 0 is ,,értékes” jegynek számít a ,,rövidebb” számok elején.)

  7. golyót helyezünk el dobozba véletlenszerűen. Mennyi a valószínűsége, hogy minden dobozban lesz golyó?

  8. Mennyi a valószínűsége, hogy egy szabályos kockával 6-szor dobva, minden dobás eredménye más?

  9. Valakinek a zsebében kulcs van, amelyek közül egy nyitja a lakása ajtaját. A kulcsokat egymás után véletlenszerűen próbálja ki. Mennyi a valószínűsége, hogy a -dikra elővett kulcs nyitja az ajtót?

  10. Szabályos dobókockával dobálunk. Mennyi a valószínűsége, hogy a negyedik hatost a tizedikre dobjuk?

  11. Mi a valószínűbb, 6 kockával legalább egy hatost dobni, vagy 12 kockával legalább két hatost dobni?

  12. Egy sakktáblára véletlenszerűen elhelyezünk 8 bástyát. Mennyi a valószínűsége, hogy a bástyák nem ütik egymást?

Ellenőrző kérdések

  1. Mit nevezünk eseménynek, elemi eseménynek, eseménytérnek?

  2. Milyen műveleteket értelmezünk események között?

  3. Mi a relatív gyakoriság?

  4. Mik a valószínűség axiómái?

  5. Mi a valószínűség klasszikus kiszámítási módja?

1.2. Halmazalgebrák és -algebrák

Bonyolultabb szituációk vizsgálatakor az a meglepő helyzet állhat elő, hogy az elemi események nem minden halmaza tekinthető eseménynek. Célszerű tehát az eseményeket úgy kijelölni, hogy jól kezelhető struktúrákat alkossanak.

Az részhalmazainak rendszerét -algebrának nevezzük, ha és -ből nem vezet ki a komplementer képzés és a megszámlálható unió képzés.

1.4. Feladat. (1) Bizonyítsuk be, hogy összes részhalmazainak halmaza (azaz ) -algebra.

(2) Bizonyítsuk be, hogy tetszőleges sok -algebra metszete -algebra.

Legyen részhalmazainak egy rendszere. A -t tartalmazó összes -algebra metszete éppen a -t tartalmazó legszűkebb -algebra. Ezt a legszűkebb -algebrát nevezzük a által generált -algebrának és -vel jelöljük.

1.2.1. A valószínűség -additivitása

Már viszonylag egyszerű feladatok megoldása során felmerül annak a kérdése, hogy hogyan lehet meghatározni (megszámlálhatóan) végtelen sok (páronként kizáró) esemény összegének a valószínűségét.

1.4. Példa. Dobjunk fel egy szabályos érmét egymás után annyiszor, míg fejet nem kapunk. Mennyi a valószínűsége, hogy a kísérlet véges számú lépésben véget ér?

Jelölje a szóban forgó eseményt, ekkor , ahol jelöli azt, hogy az -edik dobás fej, viszont a megelőzőek mindegyike írás. A klasszikus képlet szerint , . Ha kihasználhatnánk azt, hogy a valószínűség megszámlálható sok diszjunkt esemény esetén is additív módon viselkedik, akkor

eredményt kapnánk. Ez pedig összhangban áll a tapasztalattal.

1.4. Definíció. Az hármast Kolmogorov-féle valószínűségi mezőnek nevezzük, ha egy nemüres halmaz (eseménytér), részhalmazainak egy -algebrája (az események halmaza), pedig egy halmazfüggvény (valószínűség) a következő tulajdonságokkal:

ha , és ha .

Az 1.10 tulajdonság a valószínűség -additivitása. Ez nem következik szemléletes tényekből, mint az additivitás. Azonban elfogadásával hatékony matematikai elmélet építhető fel, amely a jelenségek tág körét leírja. Napjainkban a Kolmogorov-féle axiómákon nyugvó valószínűségelmélet használatos a legszélesebb körben.

1.2.2. A valószínűség folytonossága

Az 1.8-1.10 axiómákból következik, hogy

Ennek igazolására elegendő az 1.10 képletben , helyettesítést elvégezni.

Továbbá, ha eleget tesz az 1.8-1.10 axiómáknak, akkor végesen additív, azaz

ha , és , ha . 1.11 igazolásához elegendő 1.10-ban -t helyettesíteni.

Tehát az előző fejezetben a valószínűségre megadott tulajdonságok következnek az 1.8-1.10 Kolmogorov-féle axiómákból. Így az 1. fejezet megállapításai érvényesek Kolmogorov-féle valószínűségi mezőkben. Továbbá, ha véges, akkor a -additivitás nyilván ekvivalens az additivitással. Így az 1. fejezetben leírt véges valószínűségi mező speciális esete a Kolmogorov-féle valószínűségi mezőnek.

A -additivitás ekvivalens a véges additivitás és egy folytonossági feltétel teljesülésével:

1.5. Tétel. Legyen -algebra, teljesítse az 1.8 és 1.9 feltételeket. Ekkor 1.10 teljesülésének szükséges és elegendő feltétele 1.11 és az alábbi tulajdonság egyidejű teljesülése:

1.2.3. Megszámlálható valószínűségi mezők

A megszámlálható számosságú valószínűségi mezők (azaz az olyan kísérletek, melyeknek megszámlálható sok kimenetele van) teljesen leírhatók az ún. diszkrét valószínűségeloszlások segítségével.

1.6. Definíció. A számsorozatot diszkrét valószínűségeloszlásnak (röviden eloszlásnak) nevezzük, ha

Ha egy diszkrét valószínűségeloszlás, akkor legyen egy tetszőleges megszámlálható halmaz, . A

képlet nyilván valószínűséget definiál, melyre , .

1.5. Példa. Legyen , , ahol konstans. Az ismert

összefüggés alapján látható, hogy eloszlást alkot. Ezt nevezzük Poisson-eloszlásnak.

1.2.4. A valószínűség geometriai kiszámítási módja

A valószínűség tulajdonságai hasonlóak a hossz, a terület, ill. a térfogat tulajdonságaihoz.

1.6. Példa. Dobjunk egy pontot véletlenszerűen a intervallumra. A pont 0-tól mért távolságát jelölje . Mennyi a valószínűsége, hogy az , , hosszúságú szakaszokból háromszöget lehet szerkeszteni?

A háromszög szerkeszthetőségének feltétele: , , . Ezek a feltételek ekvivalensek az feltétellel. Vagyis a intervallum „fele” kedvező számunkra, így a kérdéses valószínűséget 1/2-nek tippeljük. Ennek előfeltétele szemléletes módon az, hogy tetszőlegesen rögzített esetén a intervallum bármely hosszúságú szakaszára a pont (a szakasz helyétől függetlenül) ugyanolyan valószínűséggel essen.

Legyen az egy részhalmaza, és dobjunk egy pontot véletlenszerűen -re. Legyen . Ekkor annak a valószínűsége, hogy a pont -ba esik

ahol a hossz, a terület, ill. a térfogat attól függően, hogy az egyenesen, a síkon, ill. a térben vagyunk (nyilván a esetre szorítkozunk). Az 1.13 képlet a valószínűség geometriai kiszámítási módja, mely nyilvánvaló analógiát mutat a klassszikus kiszámítási móddal.

Jelöljük -vel az félig nyílt (pontosabban alulról zárt, felülről nyílt) tégláinak, azaz a

, alakú halmazoknak az összességét.

A által generált -algebrát -vel jelöljük, és elemeit Borel-halmazoknak nevezzük.

A térfogatnak megfelelő mértéket kívánunk definiálni -n. Ha az 1.14 által definiált, akkor legyen

1.7. Tétel. Egyértelműen létezik Borel-halmazain egy olyan nemnegatív, -additív halmazfüggvény, melyre 1.15 teljesül. Ezt a -t -dimenziós Lebesgue-mértéknek nevezzük.

1.7. Példa. Dobjunk egy pontot véletlenszerűen egy -es négyzetre. Jelölje a pont távolságát a legközelebbi oldaltól. Határozzuk meg -t!

1.3. ábra - Az Az a szélességű sáv az 1.3. példában szélességű sáv az 1.3. példában

Az a szélességű sáv az 1.3. példában

Nyilván , ha , és , ha . Ha , akkor a ,,kedvező rész” egy ,, szélességű sáv” a négyzet ,,szélén” (1.3. ábra), aminek a területe . Ezért , .

Gyakorlatok

  1. Legyen -algebra. Bizonyítsuk be, hogy -ből nem vezet ki a megszámlálható metszet képzés!

  2. Határozzuk meg a Poisson-eloszlás maximális tagját! (Útmutató: vizsgáljuk két szomszédos tag nagyságviszonyát.)

  3. Bizonyítsuk be, hogy , diszkrét eloszlást alkot, ahol (ún. geometriai eloszlás). (A konvenciót használjuk.)

  4. Helyezzünk el golyókat véletlenszerűen dobozban. A kísérletet addig folytassuk, amíg nem kerül golyó az első dobozba. Mennyi a valószínűsége, hogy a kísérlet számú lépésben véget ér?

  5. Bizonyítsuk be, hogy a 1.5 Tételben szereplő 1.12 feltétel helyettesíthető a következő feltételek bármelyikével.

    ha .

    ha A 1.16 és 1.17 feltételeket is a valószínűség folytonosságának nevezik.

Ellenőrző kérdések

  1. Mit nevezünk -algebrának?

  2. Mi a Kolmogorov-féle valószínűségi mező?

  3. Mi a valószínűség geometriai kiszámítási módja?

1.3. A feltételes valószínűség

1.3.1. A feltételes valószínűség fogalma

Tegyük fel, hogy az esemény valószínűségére vagyunk kíváncsiak, de ismeretes számunkra, hogy a esemény bekövetkezett. A valószínűség bevezetésekor használt relatív gyakoriságos megközelítést alkalmazzuk most is. Ismételjük meg a kísérletünket -szer, de csak azokat a végrehajtásokat vegyük figyelembe, amelyekben bekövetkezett. Ezen részsorozatban az relatív gyakorisága

Ez utóbbi pedig körül ingadozik. Így ezt érdemes elfogadni a feltételes valószínűségnek.

1.8. Definíció. Legyen és esemény, . Ekkor az esemény -re vonatkozó feltételes valószínűségén a

mennyiséget értjük.

1.8. Példa. (a) A feltételes valószínűség végeredményben az egész eseménytér egy részére leszűkített valószínűség. Ez leginkább a részsokaságból történő mintavétellel szemléltethető. Tekintsünk egy 10000 fős populációt, ebben 5050 nő és 4950 férfi van. A nők között 100, a férfiak között 900 180 cm-nél magasabb található. Ha véletlenszerűen kiválasztunk egy embert a populációból, akkor annak a valószínűsége, hogy az 180 cm-nél magasabb (a klasszikus képlet alapján) . Ha a nők közül választunk ki egyet, akkor ugyanez a valószínűség . A feltételes valószínűség képletével számolva:

tehát a két felfogás azonos eredményre vezet. Klasszikus valószínűségi mező esetén a kétféle számolás mindig csak az ,,összes esetek számával” történő bővítésben (egyszerűsítésben) különbözik egymástól.

(b) Egy szelvénnyel lottózunk. A lottóhúzást figyeljük; az első négy kihúzott szám szerepel a szelvényünkön. Most következik az ötödik húzás. Mennyi a valószínűsége, hogy ötösünk lesz?

Jelölje azt az eseményt, hogy ötösünk lesz, azt, hogy az első 4 kihúzott számot eltaláltuk.

Ugyanerre az eredményre jutnánk akkor is, ha úgy okoskodnánk, hogy mivel négyet már eltaláltunk, a maradék 86-ból kell egyet eltalálnunk. Ez utóbbi esélye 1/86.

Általában is igaz, hogy a feltételes valószínűséget úgy is ki lehet számítani, hogy az eseményteret ,,leszűkítjük” a feltételben szereplő eseményre. Ennek hátterét világítja meg a következő állítás.

1.9. Tétel. Legyen valószínűségi mező, egy rögzített esemény, . Jelölje az alakú halmazokat, ahol . Legyen minden -re. Ekkor valószínűségi mező.

Az is nyilvánvaló, hogy éppen azon eseményekből áll, melyek részei. pedig az eredeti valószínűség ezekre való megszorításával majd ,,normálásával” adódik. Konkrét feladatok megoldásában éppen a valószínűség megtalálása a probléma.

1.9. Példa. Egy osztályban diák van, közülük -et kisorsolunk, akik dolgozatot írnak. Mennyi a valószínűsége, hogy a legrosszabb tanuló dolgozatot ír, feltéve, hogy a legjobb ír?

Jelölje azt az eseményt, hogy a legrosszabb ír, azt, hogy a legjobb ír. Ekkor

Közvetlen okoskodással is megoldhatjuk a feladatot. Szorítsuk meg a sorsolást arra, hogy a legjobbat már eleve kisorsoltuk. Így diákból kell kiválasztani -et, és kérdés annak a valószínűsége, hogy a legrosszabb tanuló benne lesz a kiválasztottak között. Így a klasszikus képlettel az

eredményre jutunk, ami megegyezik az előzővel.

1.3.2. A teljes valószínűség tétele

A valószínűségi mező gyakran felbontható olyan részekre, amelyeket külön-külön már jól tudunk kezelni.

1.10. Definíció. Események egy sorozatát teljes eseményrendszernek nevezzük, ha egymást páronként kizárják és összegük az egész eseménytér.

Tehát egy teljes eseményrendszer nem más, mint egy diszjunkt eseményekre történő felbontása (1.4. ábra). Egy teljes eseményrendszerre nyilván .

1.4. ábra - Teljes eseményrendszer

Teljes eseményrendszer

Tágabb értelemben teljes eseményrendszernek szoktuk nevezni események olyan sorozatát is, amelyek egymást páronként kizárják és valószínűségeik összege 1.

1.11. Tétel. Legyen egy pozitív valószínűségű eseményekből álló teljes eseményrendszer. Ekkor bármely eseményre

Bizonyítás. Az diszjunkt részekre bontás fennáll. Így a összefüggés felhasználásával a valószínűség -additivitásából adódik az állítás.

A teljes valószínűség tételét úgy alkalmazzuk, hogy a valószínűségi mezőt részekre bontjuk úgy, hogy az egyes részeken belül a (feltételes) valószínűség egyszerűen kiszámítható, és ezen valószínűségeket a részek valószínűségeivel súlyozva összeadjuk. Az eljárás pont az, amit különböző koncentrációjú keverékek összeöntésével kapott keverék koncentrációjának kiszámítására használunk. Egy tipikus példa a következő.

1.10. Példa. Három gép gyárt csavarokat. Az első gép 1%, a második 2%, a harmadik 3% selejtet produkál. Az első gép az össztermék 50%-át, a második 30%-át, a harmadik 20%-át állítja elő. Az össztermékből véletlenszerűen választva egyet, mennyi a valószínűsége, hogy selejtes.

A teljes valószínűség tétele alapján a megoldás

1.11. Példa. Dobjunk fel egy kockát, és a dobás eredményétől függően más-más ,,hamis” érmét. Nevezetesen, ha a kockával -t dobunk, akkor olyan érmét dobunk fel, amelyen a fej dobás valószínűsége . Mennyi a valószínűsége, hogy az érmével fejet dobunk?

Megjegyezzük, hogy a teljes valószínűség tétele különösen alkalmas ,,kétfázisú” kísérletek leírására, miként ezt az 1.11. Példa is mutatja.

1.3.3. Bayes tétele

Ha egy ,,kétfázisú” kísérletben a második fázis eredményeiből akarunk visszakövetkeztetni az első fázis eredményére, akkor a Bayes-tétel hasznos segédeszköz.

Legyen és két, pozitív valószínűségű esemény. A feltételes valószínűség definíciójából

Ez a Bayes-formula.

1.12. Tétel. Legyen egy esemény, teljes eseményrendszer, . Ekkor

minden -re.

Bizonyítás. Alkalmazzuk a Bayes-formulát, majd kifejtésére a teljes valószínűség tételét.

1.12. Példa. Az 1.10. Példában leírt kísérletet tekintjük. Ha egy találomra kiválasztott csavar selejtes, mennyi a valószínűsége, hogy az első gép gyártotta?

Gyakorlatok

  1. Tegyük fel, hogy db termék között db selejt van. Megvizsgálunk db terméket. Feltéve, hogy az első három vizsgált termék hibátlan, mennyi a valószínűsége, hogy az megvizsgált termékből selejt lesz? Oldjuk meg a feladatot a feltételes valószínűség definíciója alapján és ,,közvetlen” számolással is!

  2. Bizonyítsuk be, hogy

    ahol olyan események, melyekre .

  3. Legyen , . Lássuk be, hogy .

  4. Pistike anyukája elrejt egy csokit 3 doboz egyikébe. Pistike kiválaszt egy dobozt. Ezután az anyuka a maradék két doboz közül felnyit egyet, melyről tudja, hogy nincs benne csoki. Ezután megkérdezi Pistikét, hogy akarja-e az általa kiválasztott doboz helyett inkább a másikat (természetesen a nem felnyitottat). Érdemes-e Pistikének váltani?

  5. Ulti. 32 lapos kártyát 3 játékos között véletlenszerűen elosztunk, az első játékos 12 lapot, a másik kettő 10-10 lapot kap.

    1. Mennyi a valószínűsége, hogy a piros tízes és a piros hetes egy kézben lesz?

    2. Feltéve, hogy az első játékos kezében van az összes piros, kivéve a 10-est és a 7-est, valamint a zöld ász, király, felső és 10-es, mennyi a valószínűsége, hogy a piros 10-es és 7-es egy kézben van?

  6. Egy urnában db zöld és db sárga golyó van. Véletlenszerűen húzunk egyet a golyók közül. A golyót visszatesszük, és vele együtt számú ugyanolyan és számú ellentétes színű golyót teszünk az urnába. Mennyi a valószínűsége, hogy 4 húzásra a ,,zöld, zöld, zöld, sárga” sorozat adódjék?

  7. Az előző feldatot tekintsük esetén. Mennyi a valószínűsége, hogy húzásból valamely rögzített helyen zöld, a maradék helyen sárga golyó adódik.

  8. Egy 1000 fős városkában a választáson két párt indul. Kezdetben mindkét pártnak 500-500 szimpatizánsa van. Minden nap interjút készítek egy véletlenszerűen kiválasztott emberrel a városból. Minden meginterjúvolt 100 embert átcsábít a saját táborába. Mennyi a valószínűsége, hogy 5 nap múltán már csak az egyik pártnak lesznek hívei?

  9. A diffúzió Ehrenfest-féle modellje. Két tartályban összesen molekula helyezkedik el. Minden lépésben véletlenszerűen választunk egy molekulát, és azt áttesszük a másik tartályba. Legyen kiindulásul az első tartályban molekula, a másodikban . Milyen lesz a tartályok között a molekulák eloszlása 1, 2, illetve 3 lépés múlva?

  10. Dobjunk fel egy kockát. Azután dobjunk fel annyi kockát, amennyi az első dobás eredménye.

    1. Mennyi a valószínűsége, hogy a másodszorra feldobott kockák valamelyikén 6-ost kapunk?

    2. Mennyi a valószínűsége, hogy az első dobás 6-os volt feltéve, hogy a második dobás során nem kaptunk 6-ost?

Ellenőrző kérdések

  1. Mit nevezünk feltételes valószínűségnek?

  2. Mit állít a teljes valószínűség tétele?

  3. Mit állít a Bayes-tétel?

1.4. Események függetlensége

1.4.1. Két esemény függetlensége

A köznapi életben akkor mondjuk, hogy két jelenség független egymástól, ha egyik sem befolyásol(hat)ja a másikat. Események nyelvén ez azt jelenti, hogy az egyik esemény bekövetkezése nem befolyásolja (nem is rontja, nem is javítja) a másik bekövetkezési esélyét. Mivel a esemény (!) bekövetkezésekor az bekövetkezésének esélyét a feltételes valószínűség jellemzi, így azt mondhatjuk, hogy az akkor független -től, ha

Ennek a definíciónak az a hátránya, hogy nem szimmetrikus -ban és -ben, valamint csak esetén értelmes. A definíció finomítása előtt azonban tekintsünk példákat.

1.13. Példa. Jelentse azt az eseményt, hogy egy szelvénnyel játszva, ötösünk lesz a lottón. Ekkor . Ha a lottóhúzást figyeljük és jelenti azt, hogy már négy számunkat kihúzták, és még egy szám húzása hátravan, akkor . Az ötös találat esélye nyilván nem független attól, hogy már legalább négyesünk van. A fenti számok is mutatják, hogy bekövetkezte jelentősen „megnövelte esélyét”.

Tekintsünk egy másik esetet.

1.14. Példa. Két kockát dobunk fel. Jelentse azt, hogy az elsőn, pedig azt, hogy a másodikon 6-ost dobunk. Ekkor

A tapasztalat is azt mutatja, hogy az egyik kockán kijövő szám nem befolyásolja azt, hogy a másikon mi adódik.

A fenti példák azt sugallják, hogy az 1.18 képlet jól ragadja meg a függetlenség szemléletes fogalmát. Szorozzuk most meg 1.18 mindkét oldalát -vel. Ekkor

adódik. Ha , akkor 1.19-t -val osztva

adódik.

Nyilván esetén 1.19 ekvivalens 1.18-cal, esetén 1.19 ekvivalens 1.20-szal, míg ha vagy , vagy , akkor 1.19 a triviális egyenlőségbe megy át, azaz mindig tejesül, semmilyen plusz feltételt nem jelent -ra és -re. Így 1.18, azaz független -től, vagy 1.20, azaz független -tól, definíciók helyett 1.19-et érdemes elfogadni.

1.13. Definíció. Azt mondjuk, hogy és független események, ha

1.5. Feladat. a) Bizonyítsuk be, hogy ha és független, akkor és , és , valamint és is független eseménypárok.

b) Bizonyítsuk be, hogy akkor és csak akkor független bármely eseménytől, ha vagy .

A függetlenség 1.19 definiáló egyenletéhez a feltételes valószínűség közbeiktatása nélkül, közvetlen heurisztikus úton is eljuthatunk. Legyen pl. , . és függetlenségén azt akarjuk érteni, hogy bekövetkezése nem befolyásolja bekövetkezésének az esélyét. Az esemény sok kísérletből az esetek kb. 30%-ban következik be. Ugyancsak 30%-ban kell tehát akkor is bekövetkeznie -nak, ha bekövetkezik (és persze akkor is, ha nem következik be, de ezt már ki sem kell használni). Viszont az összes esetekből kb. 60%-ban következik be és ezen belül kell bekövetkezési esélyének 30%-nak lennie. Így és együttes bekövetkezési esélye . Azaz kell legyen.

1.4.2. Több esemény függetlensége

1.14. Definíció. Az eseményeket páronként függetlennek nevezzük, ha közülük bármely két esemény független:

A köznapi szóhasználatban több jelenség (teljes) függetlensége azonban azt jelenti, hogy a jelenségek bármely csoportja együttesen sem képes befolyásolni egyetlen másikat sem. Három eseményre megfogalmazva ez a következő. Legyenek események. Ezek páronkénti függetlensége azt jelenti, hogy

Az, hogy és együttesen sem befolyásolják -t, azt jelenti, hogy és független, ez pedig ami 1.21 figyelembe vételével

Látható, hogy és valamint és függetlensége is ehhez a relációhoz vezet.

1.6. Feladat. a) Bizonyítsuk be, hogy 1.22-ból nem következik 1.21.

b) Bizonyítsuk be, hogy 1.21-ből nem következik 1.22.

A fentiek azt mutatják, hogy több esemény (teljes) függetlenségéhez a felírandó relációkat nem spórolhatjuk meg.

1.15. Definíció. Azt mondjuk, hogy az események (teljesen) függetlenek, ha bármely -re és az számok bármely kombinációjára

Tehát esemény függetlensége azt jelenti, hogy közülük akárhány különböző eseményt kiválasztva azok szorzatának a valószínűsége egyenlő a valószínűségük szorzatával. Azt sem nehéz belátni, hogy ez a definíció - eredeti célunkkal összhangban - pontosan azt jelenti, hogy az események közül tetszőlegesen kiválasztva két diszjunkt csoportot, az egyik csoport együttesen sem befolyásolhatja a másik csoport esélyét.

1.16. Definíció. Események egy tetszőleges , rendszerét függetlennek nevezzük, ha annak bármely véges részrendszere független.

Legyen és két eseményrendszer. Ezeket függetlennek nevezzük, ha bármely és események függetlenek egymástól.

Legyen eseményrendszerek egy tetszőleges halmaza. Ezeket az eseményrendszereket függetlennek nevezzük, ha bármely eseményrendszer, ahol , független.

1.17. Tétel. (Borel-Cantelli-lemma) a) Ha , akkor 1 a valószínűsége annak, hogy az események közül csak véges sok következik be.

b) Legyenek az események függetlenek. Ha , akkor 1 annak a valószínűsége, hogy az események közül végtelen sok bekövetkezzék.

1.4.3. A valószínűség geometriai kiszámítási módja és a függetlenség

1.15. Példa. Ketten megbeszélik, hogy du. 1 és 3 óra között adott helyen találkoznak, és fél órát várnak a másikra. Mennyi a valószínűsége, hogy a találkozó realizálódik? Jelölje , ill. a két érkezés időpontját. A feladat szövegében implicit módon benne van, hogy a két személy egymástól függetlenül érkezik, és érkezésük 1 és 3 között egyenletes. Ezért mindkét érkezést külön-külön a geometriai kiszámítási mód írja le:

A függetlenség miatt

1.5. ábra - A kedvező terület az 1.15. példában

A kedvező terület az 1.15. példában


Ez pedig éppen azt jelenti, hogy együttes viselkedésére is a geometriai kiszámítási mód alkalmazható, csak már a sík alkalmas tartományát kell alapul venni. (Valójában ezt csak téglalapokra igazoltuk, de a téglalapok valószínűsége meghatározza a Borel-halmazok valószínűségét.) Így példánkban az „összes terület” 4, a „kedvező terület” 7/4 (ábrázoljuk a kedvező érkezések tartományát!). Így a keresett valószínűség 7/16.

Az előző példa általánosítása kedvéért idézzük emlékezetünkbe, hogy az -dimenziós Lebesgue-mérték bevezetésekor egy -dimenziós tégla mértékét az oldalai mértékének szorzataként adtuk meg. Ez azzal analóg, ahogyan az események függetlenségét definiáltuk. Ennek alapján belátható, hogy ha a kísérleteket a valószínűség geometriai kiszámítási módjával írhatjuk le a tartományokon, akkor a kísérletek független végrehajtását szintén a valószínűség geometriai kiszámítási módjával írhatjuk le, de már -en.

1.16. Példa. Vegyünk három, egységnyi hosszúságú szakaszt. Mindegyikből vágjunk le találomra egy darabot. Mennyi a valószínűsége, hogy a megmaradó három szakaszból háromszög szerkeszthető?

1.6. ábra - A kedvező térfogat az 1.16. példában

A kedvező térfogat az 1.16. példában


A kísérlet az egységkocka segítségével írható le. Az „összes térfogat” 1 (az egész egységkocka térfogata). A feladat szempontjából kedvező pontok az egységkocka

feltételnek eleget tevő pontjai. Ábrát készítve azonnal láthatjuk, hogy az egységkockából három 1/6 térfogatú gúlát kell levágni. Így a „kedvező térfogat” 1/2, azaz a keresett valószínűség 1/2.

Gyakorlatok

  1. Dobjunk fel egy kockát kétszer egymás után! Milyen függetlenségi relációk állnak fenn az alábbi események között? {Az első dobás 1,2 vagy 3}, {Az első dobás 3,4 vagy 5}, {a két dobás összege 9}. Mi a helyzet az alábbi eseményeknél: {Az első dobás 4-nél kisebb}, {A második dobás 3-nál nagyobb}, {A két dobás összege 7}?

  2. Legyen egy független eseményrendszer. Bizonyítsuk be, hogy az -k közül tetszőleges sokat -re cserélve is független eseményrendszert kapunk!

  3. Három játékos és vesz részt egy sakkversenyen. Mindhárman egyforma erősek, azaz egy-egy partiban 1/2-1/2 eséllyel nyernek, illetve veszítenek. A versenyt és kezdi. Minden forduló után a vesztes átadja a helyét az addig pihenő játékosnak. A versenyt az nyeri meg, aki két egymás utáni partiban győz. Mennyi a valószínűsége, hogy , illetve nyeri meg a versenyt? Írjuk le az eseményteret!

  4. Tekintsünk egy kísérletet és benne egy pozitív valószínűségű eseményt. Ismételjük meg a kísérletet független módon végtelen sokszor. Bizonyítsuk be, hogy 0 annak a valószínűsége, hogy csak véges sokszor következik be!

  5. Adjunk példát két, egymástól független, de egymást kizáró eseményre!

  6. Az egér két lyukon tud bemenni a konyhába, onnan szintén két lyukon keresztül a kamrába. Mind a 4 lyuknál (egymástól függetlenül) valószínűséggel ül egy macska. Feltéve, hogy az egér nem jutott be a kamrába, mennyi a valószínűsége, hogy bejutott a konyhába?

  7. Az autók 10%-a fékhibás. Egy műszeres vizsgálat 90%-os eséllyel ad helyes eredményt. Minden autót kétszer vizsgálnak meg (egymástól függetlenül). Mennyi a valószínűsége, hogy egy autó fékhibás, feltéve, hogy

    1. mindkét vizsgálat hibásnak mutatta,

    2. pontosan az egyik vizsgálat mutatta hibásnak?

  8. Legyen egy rögzített pozitív egész. Jelölje az -hez relatív prím, -nél kisebb pozitív egészek számát. Jelölje azt az eseményt, hogy az számok közül találomra kiválasztott szám -vel osztható. Lássuk be a következőket!

    1. , ha (azaz osztója -nek).

    2. Ha az különböző törzstényezői, akkor független események.

    3. .

    4. . (Itt és az előző képletben a produktum összes különböző törzstényezőjére terjed ki.)

  9. Találomra választunk három pontot a intervallumban, legyenek ezek . Mennyi annak a valószínűsége, hogy az és élekkel bíró téglatest testátlója kisebb 1-nél?

  10. Egy egységnyi oldalú négyzet két átellenes oldalán találomra választunk egy-egy pontot. Mennyi a valószínűsége, hogy a két pont távolsága kisebb, mint ?

Ellenőrző kérdések

  1. Mikor mondunk két eseményt függetlennek?

  2. Mi a különbség a páronkénti függetlenség és a teljes függetlenség között?

  3. Mi a valószínűség geometriai kiszámítási módja az egyenesen, a síkon, illetve a térben?

2. fejezet - Diszkrét valószínűségi változók

2.1. Véletlentől függő mennyiségek

2.1.1. Mennyit nyerünk?

A valószínűség fogalma támaszt nyújt ahhoz, hogy elemezzük a nyerési esélyünket bizonyos szerencsejátékok esetén. De az sem mindegy, hogy mennyit nyerünk (vagy pláne nem, hogy mennyit vesztünk)!

2.1. Példa. Dobjunk fel két dobókockát, egy fehéret és egy feketét! Annyi forintot nyerünk, amennyi a fehéren és a feketén adódó számok különbsége. (Pl. a fehéren 2-est, a feketén 5-öst dobva a nyereség, azaz 3 forintot vesztünk.) Szabályos kocka esetén - szimmetria okokból - az adódik, hogy nyerésre és vesztésre is egyenlő az esély. De az is érdekelhet bennünket, hogy milyen eséllyel vesztünk, mondjuk, 5 forintot. Jelölje a nyereményt. Ekkor értéke lehet. A , valószínűségek a nyereményünk ,,eloszlását” adják. Az is látható, hogy , ahol a fehér, pedig a fekete kockán adódó számot jelöli.

2.1. Definíció. Legyen valószínűségi mező, (az elemi eseményektől függő valós értékű) függvény. -t diszkrét valószínűségi változónak nevezzük, ha értékkészlete megszámlálható és

2.1 azt fejezi ki, hogy azon elemi események halmaza, amelyben valamely konstans értéket vesz fel, legyen esemény. Ez szükséges ahhoz, hogy beszélhessünk a valószínűségéről (hisz csak eseményeknek értelmeztük a valószínűségét, és elemi események tetszőlges halmaza nem feltétlenül esemény).

2.1. Feladat. Igazoljuk, hogy ha értékkészlete , úgy akkor és csak akkor diszkrét valószínűségi változó, ha

2.1.2. Valószínűségi változók eloszlása

A továbbiakban, a rövidség kedvéért, a

jelöléseket fogjuk használni.

Legyen olyan diszkrét valószínűségi változó, melynek értékkészlete . Jelölje a eseményt, . Ekkor az , , halmazok teljes eseményrendszert alkotnak. Ebből következik, hogy a

számok diszkrét eloszlást alkotnak (azaz , , és ).

2.2. Definíció. A számokat eloszlásának nevezzük.

2.2. Példa. Jelölje a dobókockán adódó számot. Ekkor eloszlása

A fenti , , eseményekből álló teljes eseményrendszert a által generált teljes eseményrendszernek nevezzük, és -vel jelöljük. Az -t tartalmazó legszűkebb -algebrát a által generált -algebrának nevezzük, és -vel jelöljük. elemei nyilván az alakban felírható események (azaz azon események, melyek az -k közül tetszőlegesen kiválasztottak uniójaként állnak elő).

Legyen tetszőleges valós függvény. Ekkor az összetett függvény is diszkrét valószínűségi változó, mivel

tehát 2.1 teljesül. Másrészt értékkészlete (viszont ebben a számsorozatban ismétlődések is felléphetnek, ha nem egy-egyértelmű). Például is diszkrét valószínűségi változók (ha az). Ha nemnegatív (azaz , ), akkor is diszkrét valószínűségi változó.

A valószínűségi változók közötti műveleteket ,,pontonként” értelmezzük. Például

Könnyű belátni, hogy , , , (ha ) diszkrét valószínűségi változók, amennyiben és is azok.

Általában, ha kétváltozós függvény, valamint és diszkrét valószínűségi változók, akkor az

által definiált függvény is diszkrét valószínűségi változó.

2.3. Példa. (1) Egy urnában piros és fehér golyó van (). Visszatevés nélkül húzzunk ki golyót ()! Jelölje a kihúzott piros golyók számát. Ekkor hipergeometrikus eloszlású:

(2) Ha az előző példában visszatevéses húzást tekintünk, akkor binomiális eloszlású valószínűségi változóhoz jutunk:

Általánosabban, ha egy kísérletet -szer függetlenül megismételünk, és jelenti a valószínűségű esemény bekövetkezéseinek a számát, akkor

A 2.2-t teljesítő -t -edrendű, paraméterű binomiális eloszlásúnak nevezzük. Ha , akkor -t Bernoulli-eloszlásúnak nevezzük.

(3) Azt mondjuk, hogy paraméterű Poisson-eloszlású, ha

ahol konstans.

(4) A valószínűségi változót -edrendű, paraméterű negatív binomiális eloszlásúnak nevezzük, ha

ahol . esetén a geometriai eloszláshoz jutunk.

Tekintsük a , , eloszlású valószínűségi változót. Legyen és a szerint definiálva. A függvény lokális maximumhelyét az eloszlás móduszának hívjuk. Amennyiben csak egy módusz van, akkor az eloszlást unimodálisnak (egycsúcsosnak) nevezzük. Ekkor a módusz éppen a legnagyobb -hez tartozó .

2.1.3. Együttes eloszlások

Az alábbi (nyilvánvaló) példa két valószínűségi változó egymáshoz való viszonyának két szélsőséges esetét mutatja be.

2.4. Példa. Dobjunk fel két kockát! Jelölje és az első, illetve a második kockán kapott számot. A klasszikus képlettel számolva:

Azaz a és események függetlenek. Másrészt, ha is és is az első kockán dobott számot jelenti, akkor

Ebben az esetben nemhogy független -től, hanem meghatározza azt.

A példa arra is rámutat, hogy és külön-külön vett eloszlása nem határozza meg és együttes eloszlását.

2.3. Definíció. Legyen a és az diszkrét valószínűségi változók értékkészlete , illetve . Ekkor és együttes eloszlásán a

számokat értjük. Ebben a vonatkozásban a és külön-külön tekintett eloszlása marginális (más szóval perem-) eloszlásként jelenik meg, amint azt az ún. kontingencia táblázat mutatja:

Itt

és

Tehát a peremeloszlások a kontingencia táblázat peremén szereplő eloszlások. Nyilván

és az itt szereplő mennyiségek nemnegatívak.

2.4. Tétel. A és együttes eloszlása meghatározza a peremeloszlásokat, de a peremeloszlások nem határozzák meg egyértelműen az együttes eloszlást.

Bizonyítás. Lásd a 2.4 példát.

2.2. Feladat. Három valószínűségi változó együttes eloszlását a

szerint definiáljuk. Hogyan határozható meg a mennyiségekből és együttes eloszlása (jelölése ) és eloszlása ()? Terjesszük ki az együttes eloszlás fogalmát tetszőleges véges számú valószínűségi változóra!

2.1.4. Függetlenség

Legyen és együttes eloszlása a 2.3-ban megadott. és függetlensége a következőt jelenti: az, hogy felvesz valamilyen értéket, nem befolyásolja annak az esélyét, hogy valamely értéket vegyen fel.

2.5. Definíció. Azt mondjuk, hogy és független, ha

A valószínűségi változókat páronként függetleneknek nevezzük, ha közülük bármely kettő független.

A valószínűségi változókat (teljesen) függetleneknek nevezzük, ha

teljesül minden -re a valószínűségi változók értékészletéből.

2.3. Feladat. Legyenek függetlenek. Lássuk be, hogy ekkor bármely részrendszere is független!

2.6. Definíció. Valószínűségi változók egy tetszőleges rendszerét függetlennek nevezünk, ha bármely véges részrendszere független.

2.7. Megjegyzés. A definícióból adódik, hogy valószínűségi változók tetszőleges családja akkor és csak akkor független, ha az általuk generált teljes eseményrendszerek családja független.

2.8. Tétel. Ha független diszkrét valószínűségi változók és valós függvények, akkor az valószínűségi változók is függetlenek.

2.1.5. A konvolúció

Legyenek és független valószínűségi változók , , eloszlással. Ekkor a eloszlása

Ha és csak egész értékeket vehetnek fel, azaz , , ahol , akkor -ra

Ha és csak nemnegatív egész értékeket vehetnek fel, akkor

2.9. Definíció. A 2.5-2.6 által meghatározott mennyiségeket (azaz eloszlását) a és eloszlások konvolúciójának nevezzük.

2.5. Példa. Legyenek és független , illetve rendű és paraméterű binomiális eloszlású valószínűségi változók, azaz

Ekkor -ra

ahol . Így a konvolúció is binomiális eloszlású. Az utolsó lépésben az ismert

összefüggést (az ún. Vandermonde-konvolúciót) alkalmaztuk. Az összegzés minden esetben olyan -kre terjed ki, melyekre és .

Tekintsünk egy kísérletet, és ezzel összefüggésben egy valószínűségű eseményt. Ismételjük meg a kísérletet -szer, egymástól függetlenül. Jelölje annak indikátorát, hogy az esemény a -adik kísérletben bekövetkezik. Ekkor Bernoulli-eloszlású:

A valószínűségi változók függetlenek és egyforma Bernoulli-eloszlásúak. Ha jelenti az esemény bekövetkezései számát az ismétlésből, akkor . Mivel -edrendű paraméterű binomiális eloszású, így a következőt kaptuk.

2.10. Tétel. darab független, paraméterű Bernoulli-eloszlású valószínűségi változó összege -edrendű, paraméterű binomiális eloszlású.

Tekintsük megint a kísérlet független ismétléseit és a valószínűségű esemény bekövetkezéseit. Jelölje azt, hogy az hányadik ismétlés során következik be először, azt, hogy az első bekövetkezés után hányadik lépésben következik be újra , azt, hogy a második bekövetkezés után hányadik lépésben következik be újra , Nyilván független elsőrendű negatív binomiális eloszlású, pedig -edrendű negatív binomiális eloszlású. Ebből adódik:

2.11. Tétel. darab, azonos paraméterű, független, elsőrendű negatív binomiális eloszlású valószínűségi változó összege -edrendű, paraméterű negatív binomiális eloszlású.

Gyakorlatok

  1. Adjunk meg két olyan valószínűségi változót, amelyek különböznek egymástól, de eloszlásuk megegyezik! (Akkor mondjuk, hogy a és diszkrét valószínűségi változók eloszlása megegyezik, ha minden esetén.)

  2. Legyen adott egy eloszlás és az páronként különböző számok. Adjunk meg olyan valószínűségi változót, melyre !

  3. Igazoljuk, hogy egy és egy paraméterű Poisson-eloszlás konvolúciója () paraméterű Poisson-eloszlás!

  4. Mi a lottón kihúzott öt szám közül a legkisebbnek az eloszlása?

  5. Legyen geometriai eloszlású:

    Lássuk be, hogy örökifjú, azaz

  6. Legyen pozitív egész értékű valószínűségi változó. Vizsgáljuk meg, hogy a örökifjú tulajdonságából következik-e, hogy geometriai eloszlású.

  7. Egy gép valószínűséggel gyárt jó, valószínűséggel selejt terméket. Adjuk meg két egymás utáni selejt között gyártott jó termékek mennyiségének eloszlását! Adjuk meg a tiszta selejt szériák hosszának eloszlását is!

Ellenőrző kérdések

  1. Mit nevezünk diszkrét valószínűségi változónak?

  2. Mikor mondjuk, hogy hipergeometrikus-, binomiális-, illetve Poisson-eloszlású?

  3. Mikor mondjuk, hogy és függetlenek?

2.2. Diszkrét valószínűségi változók várható értéke

2.2.1. A várható nyeremény

A szerencsejátékokban a nyeremény pontos nagysága nyilván nem látható előre. A játékosok azonban legalább annyit szeretnének tudni, hogy számukra kedvező vagy kedvezőtlen-e a játék.

2.6. Példa. Dobókockával dobva annyit nyerünk, amilyen számot dobtunk. Ekkor a nyeremény átlagos értéke:

Ha azonban hamis kockával játszunk, például olyannal, amelynél a 6-os dobás esélye 1/4, az 1-es dobásé 1/12, a többié 1/6, akkor az átlagos nyeremény nyilván nagyobb lesz. Ekkor az

súlyozott számtani középpel érdemes a várható nyereményt jellemezni.

2.12. Definíció. Azt mondjuk, hogy a eloszlású valószínűségi változónak létezik véges várható értéke, ha a sor abszolút konvergens. Ekkor az

számot a várható értékének nevezzük.

2.13. Megjegyzés. (1) várható értéke a által felvett értékek súlyozott számtani közepe. A valószínűségi változó a várható értéke körül mutat véletlen ingadozást.

(2) A sor abszolút konvergenciája biztosítja, hogy a várható érték az -k sorszámozásától független véges szám.

2.4. Feladat. (1) Adjunk példát olyan valószínűségi változóra, amelyre a sor divergens, illetve értéke vagy ! (Ha értékkészlete véges, akkor ezek nyilván nem fordulhatnak elő.)

(2) Adjunk példát olyan valószínűségi változóra, mely a várható értékét nem veszi fel értékként sohasem!

2.7. Példa. A

Poisson-eloszlású valószínűségi változó várható értéke az alábbi módon számítható ki:

Itt az összefüggést alkalmaztuk.

2.14. Tétel. Legyen eloszlása . Legyen és . Ekkor

feltéve, hogy az egyenlőség valamelyik oldalát definiáló sor abszolút konvergens.

A következő tétel a várható érték és a valószínűségi változókon értelmezett műveletek kapcsolatát mutatja be.

2.15. Tétel. A várható érték lineáris funkcionál (a véges várható értékkel rendelkező valószínűségi változók terén). Részletesebben, ha és létezik és véges, konstans, akkor

is létezik és véges, és ;

is létezik és véges, és .

2.16. Következmény. Ha a valószínűségi változóknak létezik véges várható értékük, és konstansok, akkor

2.8. Példa. Legyen -edrendű paraméterű binomiális eloszlású. Ekkor a 2.10 Tétel alapján , ahol Bernoulli-eloszlású. minden -re. Ekkor

Az eredmény úgy interpretálható, hogy ha egy esemény átlagosan a végrehajtások -edrészében következik be, akkor végrehajtásból átlagosan -szer következik be.

Vizsgáljuk meg a várható értéket negatív binomiális eloszlású valószínűségi változók összegére is.

2.9. Példa. Legyen -edrendű paraméterű negatív binomiális eloszlású. Ekkor , ahol elsőrendű negatív binomiális eloszlásúak (2.11. Tétel):

(A számolás során azt használtuk ki, hogy konvergens hatványsor tagonként deriválható.) A fentiek alapján . Az eredmény úgy interpretálható, hogy ha egy esemény valószínűsége , akkor átlagosan -szer kell elvégezni a kísérletet ahhoz, hogy az esemény egyszer bekövetkezzék, továbbá -szer ahhoz, hogy -szer következzék be az esemény.

2.2.2. A várható érték és a függetlenség

2.17. Tétel. Ha és független valószínűségi változók, és létezik és véges, akkor is létezik és véges, és

Bizonyítás. Ha létezik és véges, akkor

A függetlenség miatt

Viszont létezik és véges, hisz és végességéből következik a 2.7 alatti sor abszolút konvergenciája. Ez utóbbit lényegében az előző levezetés helyett -re történő elvégzésével láthatjuk be.

Gyakorlatok

  1. Egy szabályos érmével dobunk. Fej esetén 1 Ft-ot nyerünk, írás esetén 1 Ft-ot vesztünk. Ekkor a nyeremény várható értéke 0. Ezt a játékot nem igazán „érdemes” játszani. Adjunk példát olyan játékra, amelynél a nyeremény várható értéke 0, valamilyen szempontból mégis „érdemes” játszani, illetve olyanra, amelynek 0 a várható értéke, de egyáltalán nem „érdemes” játszani!

  2. Dobjunk fel egy kockát háromszor egymás után! Jelölje a dobott számok összegét. ?

  3. Bizonyítsuk be, hogy ha , akkor !

  4. Bizonyítsuk be, hogy ha és , akkor !

  5. Bizonyítsuk be, hogy ha és létezik és véges, akkor is létezik és véges!

  6. Bizonyítsuk be, hogy ha , akkor .

  7. Számítsuk ki a binomiális eloszlás várható értékét közvetlenül a várható érték definíciója alapján!

  8. A várható érték definíciója alapján közvetlen számolással igazoljuk, hogy a hipergeometrikus eloszlás várható értéke .

  9. Egy játékos a pénzfeldobásnál úgy játszik, hogy mindig a „fejre” fogad. Ha nem nyer, akkor duplázza a tétet, és az első nyerésnél abbahagyja a játékot. Mennyi a nyereményének várható értéke?

  10. Legyen Poisson-eloszlású. Határozzuk meg várható értékét!

  11. Tegyük fel, hogy . Bizonyítsuk be, hogy csak 0 vagy 1 értéket vehet fel!

Ellenőrző kérdések

  1. Mi a várható érték definíciója?

  2. Mit jelent az, hogy a várható érték lineáris funkcionál?

  3. Mikor igaz, hogy ?

2.3. A szórás

2.3.1. Az ingadozás mértéke

A várható érték önmagában nem tökéletes jellemzője az eloszlásnak.

2.10. Példa. Egy érme feldobásához kapcsolódva kétféle játékot tekintsünk. Mindkét esetben nyerünk, ha fejet dobunk, és vesztünk, ha írást, csak a tét különbözik: az első esetben 100 Ft, a második esetben 100000 Ft. Az első játékot , a másodikat írja le: . A nyeremény várható értékét tekintve a játékok nem különböznek egymástól: . A második játékot azonban csak a kockázatot kedvelők választanák, ott sokat lehet nyerni, de veszteni is. A két játék közötti különbség abban van, hogy a második esetben a nyeremény értékei nagy ingadozást mutatnak, azaz nagyon szóródnak a várható érték körül.

2.18. Definíció. Legyen valószínűségi változó, tegyük fel, hogy létezik és véges. A

mennyiséget (feltéve, hogy véges) szórásnégyzetének nevezzük. A szórásnégyzet pozitív négyzetgyökét pedig szórásnak hívjuk:

A szórás a ingadozásának mérőszáma. A szórás a valószínűségi változó értékeinek a várható értéktől való átlagos négyzetes eltérése. Technikai okokból a szórásnégyzettel gyakrabban dolgozunk, mint a szórással.

2.5. Feladat. (1) Adjunk példát olyan -re, amely esetén létezik, de !

(2) Mutassuk meg, hogy (azaz a szórást nem lehetne ilyen egyszerűen definiálni)!

2.19. Tétel. Ha , akkor

(ahol az rövid jelölése).

Bizonyítás.

A szórásnégyzetet az alábbi módon számolhatjuk ki.

2.20. Tétel. Ha , akkor

illetve

ahol a várható értéke, pedig a eloszlása: ,

Bizonyítás. Alkalmazzuk a 2.14 Tételt 2.8-ra, akkor kapjuk 2.10-et, illetve 2.9-re, akkor kapjuk 2.11-et.

Megjegyezzük, hogy az , ill. mennyiségeket -adik momentumnak, ill. -adik centrált momentumnak nevezik (). A kiszámítás

alapján történik.

A magasabb rendű momentum létezéséből és végességéből következik az alacsonyabb rendű létezése és végessége; fordítva azonban nem.

A várható érték az első momentum, a szórásnégyzet pedig a második centrált momentum.

2.11. Példa. (1) A 2.10 példában , .

(2) Legyen Poisson-eloszlású. Ekkor

Innen és a 2.4 példa alapján

2.3.2. A szórás tulajdonságai

Az alábbiakban szereplő valószínűségi változókról feltesszük, hogy véges a szórásuk. Először az ún. Steiner-formulát adjuk meg.

2.21. Tétel. Tetszőleges valós számra

2.13-ban akkor és csak akkor áll fenn egyenlőség, ha .

A bizonyítást az olvasóra bízzuk. (2.12 a várható érték linearitásából, 2.13 pedig 2.12-ből adódik).

2.13 jelentése a következő: az ingadozásnak a szórásban is testet öltő mérőszáma, azaz ún. legkisebb négyzetes eltérés értelmében éppen a várható érték az a szám, amely leginkább középértékének tekinthető, tehát amelytől való ingadozás a legkisebb.

2.22. Tétel. ; akkor és csak akkor, ha .

Bizonyítás. Mivel és , így . Továbbá akkor és csak akkor 0, ha , azaz .

Az is nyilván igaz, hogy akkor és csak akkor áll fenn, ha 1 valószínűséggel konstans.

2.23. Tétel. Bármely esetén

Bizonyítás. miatt .

2.24. Tétel. Legyenek páronként független valószínűségi változók. Ekkor

Bizonyítás. Csak esetén végezzük el az állítás igazolását.

Azt használtuk ki, hogy független esetben .

2.12. Példa. a) Legyen Bernoulli-eloszlású: , . Ekkor

b) Legyen binomiális eloszlású:

Ekkor , ahol független Bernoulli-eloszlásúak. Így

2.25. Definíció. Legyen . A standardizáltján az

valószínűségi változót értjük. Ha a standardizáltja, akkor és .

2.3.3. A Csebisev-egyenlőtlenség

A szórás segítségével felső korlátot adhatunk a várható értéktől való eltérés valószínűségére. Ez a Csebisev-egyenlőtlenség lényege. A Csebisev-egyenlőtlenség bizonyítását a Markov-egyelőtlenségre támaszkodva végezzük el.

2.26. Tétel. (Markov-egyenlőtlenség) Legyen nemnegatív valószínűségi változó, rögzített szám. Ekkor

Bizonyítás. A következő egyenlőtlenségek érvényesek:

2.27. Tétel. (Csebisev-egyenlőtlenség) Tegyük fel, hogy , és tetszőleges. Ekkor

Bizonyítás. Legyen , . Alkalmazzuk a Markov-egyenlőtlenséget!

Gyakorlatok

  1. Számítsuk ki a binomiális eloszlás szórását 2.11 segítségével közvetlenül (nem a Bernoulli-eloszlásra visszavezetve)!

  2. Igazoljuk, hogy a hipergeometrikus eloszlás szórásnégyzete

  3. Igazoljuk, hogy az elsőrendű negatív binomiális eloszlás szórásnégyzete . Az -edrendű negatív binomiális eloszlású -t független elsőrendűek összegeként előállítva, bizonyítsuk be, hogy .

  4. Egy szabályos kockával egymás után háromszor dobunk. Jelölje a hatos dobások számát. ,

  5. Igazoljuk, hogy a magasabb rendű momentum végességéből következik az alacsonyabb rendű végessége az alábbi értelemben. Ha és , akkor . (A bizonyításnál külön-külön vizsgáljuk a és a részeket.)

  6. Mennyi a várható értéke és szórásnégyzete a , eloszlású valószínűségi változónak?

Ellenőrző kérdések

  1. Mi a szórásnégyzet jelentése?

  2. Hogyan számoljuk ki a szórásnégyzetet?

  3. Mit állít a Csebisev-egyenlőtlenség?

2.4. A korrelációs együttható

2.4.1. A kovariancia

A szórás tulajdonképpen a és az távolsága, a kifejtése nyilvánvaló analógiát mutat az euklideszi távolsággal. A kovariancia pedig a belső szorzat megfelelője lesz.

2.28. Definíció. Legyen és valószínűségi változó, , , , . A és kovarianciáján a

mennyiséget értjük.

A definícióból közvetlenül adódik, hogy

A kovariancia kiszámítását segíti a

képlet, amely a várható érték linearitásából következik. Ha , jelöli és együttes eloszlását, akkor

illetve

azonnal adódik 2.14-ből, illetve 2.15-ből.

2.29. Tétel. Ha , , továbbá és függetlenek, akkor .

Bizonyítás. alapján 2.15-ből adódik az állítás.

Az állítás megfordítása nem igaz, amint az alábbi példa is mutatja.

2.13. Példa. Legyen és értékkészlete , együttes eloszlása

A kontingencia táblázat:

Ekkor

(ez a kontigencia táblázatból könnyen adódik). Így . Viszont

azaz és nem függetlenek.

2.30. Tétel. A kovariancia bilineáris funkcionál. Részletesebben: ha , , , , akkor

Bizonyítás. Elegendő belátni, hogy és . Ezek közül az első nyilvánvaló; a második:

2.4.2. A korrelációs együttható

Két valószínűségi változó közötti kapcsolat szorosságát kifejezhetjük a korrelációs együtthatóval. A korrelációs együttható lényegében két vektor által bezárt szög koszinuszát jelenti.

2.31. Definíció. Legyen , . A és korrelációs együtthatóján a

mennyiséget értjük. Ha , akkor -t és -t korrelálatlanoknak nevezzük. Ha és függetlenek, akkor korrelálatlanok, de ez fordítva nem igaz.

2.32. Tétel. a) értéke mindig és közé esik.

b) akkor és csak akkor, ha valamely és valós számokra

teljesül 1 valószínűséggel. , illetve aszerint, hogy , illetve .

Bizonyítás. Legyen , illetve a és az standardizáltja. Ekkor . Másrészt

Innen adódik, hogy .

Másrészt akkor és csak akkor teljesül, ha 2.17-ben egyenlőség áll fenn -vel, azaz . Innen 1 valószínűséggel, azaz

Tehát 2.16 fennáll és választással. A eset hasonlóan kezelhető.

2.4.3. Valószínűségi vektorváltozók

2.33. Definíció. Legyenek valószínűségi változók. Ekkor a -dimenziós vektort valószínűségi vektorváltozónak nevezzük. (Itt a transzponálás jele.) A

számokat a eloszlásának nevezzük (itt végigfut értékkészletén). eloszlása nem más, mint komponenseinek együttes eloszlása.

várható érték vektorát koordinátánként képezzük. A szórásmátrixa (kovariancia mátrixa) a elemekből álló -es mátrix. A , az vektorok és a mátrix struktúrája:

2.14. Példa. Legyen a valószínűségi változók együttes eloszlása polinomiális eloszlás:

, , , . Ekkor binomiális eloszlású paraméterrel, így és . Meghatározható és együttes eloszlása is. -re és -re felírva:

ahol és .

ahol a polinomiális tételt alkalmaztuk. Ezek alapján ,

ha . A negatív korreláció természetes, hiszen egyik komponens növelése a másik komponens csökkenését vonja maga után.

2.4.4. A legkisebb négyzetes predikció

Közelítsük -t a valamely függvénye segítségével. Azt mondjuk, hogy az legjobb predikciója (becslése, jóslása) (a legkisebb négyzetek elve szerint) valamely függvényosztályra nézve, ha és

Ha a lineáris függvények osztálya, akkor legjobb lineáris predikcióról beszélünk.

2.34. Tétel. Legyen , . Ekkor legjobb lineáris predikciója a segítségével:

Bizonyítás. A cél a

függvény minimalizálása. A parciális deriváltak:

A fenti parciális deriváltak az

helyen 0-k, ami épp 2.18-nak felel meg. Mivel a második parciális deriváltakból álló mátrix

így -nek tényleg minimuma van.

A 2.32 Tétel alapján, ha , akkor a 2.18 közelítés pontosan -t adja.

Gyakorlatok

  1. Feldobunk két szabályos kockát. Jelölje az első kockával dobott számot, pedig a két dobott szám maximumát. Határozzuk meg és együttes eloszlását! Lássuk be, hogy ; és .

  2. Egy szabályos kockát -szer földobunk. Lássuk be, hogy az 1-es és a 6-os dobások kovarianciája .

  3. Tegyük fel, hogy a és valószínűségi változók mindegyike két értéket vesz föl. Bizonyítsuk be, hogy ha , akkor és független.

  4. Legyenek és független, Poisson-eloszlású valószínűségi változók , illetve paraméterrel. Lássuk be, hogy -nek -ra vonatkozó feltételes eloszlása binomiális, azaz

    ahol .

  5. Cauchy-féle egyenlőtlenség. Tegyük fel, hogy , . Ekkor

    Egyenlőség akkor és csak akkor teljesül, ha és lineárisan függőek.

  6. Legyen polinomiális eloszlású. Lássuk be, hogy

    kovariancia mátrixa , ahol az -es egységmátrix, -dimenziós egységvektor ( a transzponálás jele).

Ellenőrző kérdések

  1. Mi a kovariancia definíciója és kiszámítási módja?

  2. Mi a korrelációs együttható definíciója?

  3. A korrelálatlanságból következik-e a függetlenség?

2.5. Nevezetes diszkrét eloszlások

2.5.1. A hipergeometrikus eloszlás

Egy urnában piros és fehér golyó van (). Visszatevés nélkül húzzunk ki () golyót. Mennyi a valószínűsége, hogy a kihúzott golyók között piros van? A kérdéses eseményt -val jelölve

adódik a klasszikus képlet alapján. Ezt nevezzük hipergeometrikus eloszlásnak. Ha hipergeometrikus eloszlású valószínűségi változó, akkor a várható értéke:

a szórásnégyzete:

A valószínűségek növekvőek, amíg meg nem haladja -t. Ha egész, akkor két maximumhely van: és .

2.1. ábra - A hipergeometrikus eloszlás A hipergeometrikus eloszlás N=20 , M=12 és n=6 esetén, A hipergeometrikus eloszlás N=20 , M=12 és n=6 esetén és A hipergeometrikus eloszlás N=20 , M=12 és n=6 esetén esetén

A hipergeometrikus eloszlás N=20 , M=12 és n=6 esetén

2.35. Tétel. Amennyiben úgy tart a végtelenhez, hogy közben (ahol ), akkor a hipergeometrikus eloszlás tart a binomiális eloszláshoz:

2.5.2. A polihipergeometrikus eloszlás

Legyen egy urnában különböző színű golyó, az -edik színből , . Legyen . Jelölje azt az eseményt, hogy -szer húzva visszatevés nélkül, az első színből , az -edik színből adódik (). Ekkor

, .

Az ilyen eloszlást polihipergeometrikus eloszlásnak nevezzük.

2.5.3. A binomiális eloszlás

Egy urnában piros és fehér golyó van (). Visszatevéssel húzunk ki golyót. (A visszatevéses húzás azt jelenti, hogy kihúzunk egy golyót, feljegyezzük a színét, visszatesszük, ezután még egyszer húzunk, feljegyezzük a színét, ) Mennyi a valószínűsége, hogy a kihúzott golyók között piros van?

A kérdéses eseményt -val jelölve, a klasszikus képlet alapján

Ezt nevezzük binomiális eloszlásnak.

Véges Bernoulli-féle kísérletsorozat.

A binomiális eloszláshoz vezető kísérletet a következő módon általánosíthatjuk. Tekintsünk egy kísérletet és ebben egy eseményt. Ismételjük meg a kísérletet -szer, egymástól függetlenül. Jelölje azt az eseményt, hogy az végrehajtásból -szor következik be az esemény, pedig jelölje bekövetkezései számát.

A háttérben levő valószínűségi mezőt a következő módon lehet megkonstruálni. Mivel csak az és bekövetkezését figyeljük, így a kiinduló valószínűségi mező két elemi eseményre redukálható: , 1 jelöli az , 0 az bekövetkezését. . A kísérlet -szeri független végrehajtását az önmagával képzett -szeres szorzata írja le. Ez a valószínűségi mező a 0-ákból és 1-ekből álló hosszúságú sorozatokból áll. Ha egy sorozatban db 1-es és db 0 áll (pl. , azaz az első helyen 1, a maradék helyen 0), akkor . az összes olyan sorozatból áll, amelyben db 1-es és db 0 van. Egy ilyen sorozat valószínűsége (a 0-ák és 1-esek sorrendjétől függetlenül) . Összesen számú ilyen sorozat van. Így

Ez a binomiális eloszlás általános alakja.

2.2. ábra - p=0.25 , n=10 esetén a binomiális eloszlás, p=0.25 , n=10 esetén a binomiális eloszlás esetén a binomiális eloszlás

p=0.25 , n=10 esetén a binomiális eloszlás

2.6. Feladat. a) A szorzat valószínűségi mező fogalma nélkül, csupán a függetlenség fogalmára támaszkodva vezessük le a 2.21 összefüggést!

b) Vezessük le a 2.20 összefüggést a függetlenség felhasználása nélkül, csak arra támaszkodva, hogy mind az számú elemi esemény egyformán valószínű!

A valószínűségek növekvőek, amíg eléri azt az egészet, melyre

utána pedig csökkenőek. Ha egész, akkor két maximumhely van: és . esetén a valószínűségek a 2.2. ábrán láthatóak.

A Bernoulli-eloszlás.

A véges Bernoulli-féle kísérletsorozatban jelölje az -edik kísérletben az esemény bekövetkezései számát. Ekkor Bernoulli-eloszlású:

A kísérlet leírásából azonnal adódik, hogy a binomiális eloszlású előáll alakban, ahol független Bernoulli-eloszlásúak.

A binomiális eloszlás jellemzői.

A momentumok:

A szórásnégyzet:

2.5.4. A binomiális eloszlás további tulajdonságai

Ha és független, binomiális eloszlású valószínűségi változók , illetve paraméterrel, akkor is binomiális eloszlású paraméterrel.

A binomiális eloszlás standardizáltja aszimptotikusan normális eloszlású:

Amennyiben úgy tart a végtelenhez, hogy közben úgy változik, hogy konstans marad, akkor viszont a határeloszlás Poisson:

Ha és független binomiális eloszlású valószínűségi változók , illetve paraméterrel, akkor feltételes eloszlása -re vonatkozóan hipergeometrikus:

2.5.5. A polinomiális eloszlás

Tekintsünk egy kísérletet és ehhez kapcsolódva egy teljes eseményrendszert: . Legyen . Nyilván . Ismételjük meg a kísérletet -szer, egymástól függetlenül. Jelölje azt az eseményt, hogy az esemény -szer, , az -szer következik be. Ekkor

ahol , és .

2.15. Példa. A 2.21 képlethez vezető okoskodást általánosítva, igazoljuk a 2.22 formulát!

2.5.6. A negatív binomiális eloszlás

Tekintsünk egy kísérletet, ebben egy valószínűségű eseményt. Ismételjük a kísérletet (független módon). Jelölje azt az eseményt, hogy a esemény -edszerre a -edik ismétlésnél fordul elő. Ekkor

A várható érték:

A szórásnégyzet:

Ha és független, paraméterű és , illetve rendű negatív binomiális eloszlasúak, akkor paraméterű, rendű negatív binomiális eloszlású.

2.7. Feladat. Bizonyítsuk be, hogy a negatív binomiális eloszláshoz vezető kísérlet esetén 1 valószínűséggel véges sok lépésben véget ér!

A negatív binomiális eloszlás esetén az ún. geometriai eloszlást szolgáltatja.

A geometriai eloszlás „örökifjú”:

azaz ha -nél „tovább él”, akkor a utáni élettartama ugyanolyan eloszlású, mintha a időpontban „született” volna. Ez a tulajdonság jellemzi is a geometriai eloszlást a pozitív egész értékű valószínűségi változók között.

2.5.7. A Poisson-eloszlás

Legyen . A

által definiált eloszlást, ahol állandó, Poisson-eloszlásnak nevezzük. Nyilván , és a

képlet alapján . Így a fenti számok tényleg eloszlást alkotnak.

A valószínűségek növekvőek, amíg eléri -t (egészrész), utána csökkenőek (ha egész, akkor és esetén is maximum van).

2.3. ábra - \lambda=2 paraméterű Poisson-eloszlás paraméterű Poisson-eloszlás

\lambda=2 paraméterű Poisson-eloszlás

A várható érték:

a szórásnégyzet:

Ha és független Poisson-eloszlásúak , illetve paraméterrel, akkor is Poisson-eloszlású paraméterrel.

Legyen és független Poisson-eloszlású , illetve paraméterrel. Ekkor

azaz a feltételes eloszlás , paraméterű binomiális.

A Poisson-eloszlás gyakran fellép véletlen elhelyezkedési problémákban. Figyeljünk egy egyenlő részre osztott földterületet. számú fűmagot hoz a területre véletlenszerűen a szél. Mennyi a valószínűsége, hogy egy részre éppen mag esik? Ha feltételezzük, hogy a fűmagvak egymástól függetlenül érkeznek, és az területrész mindegyikére azonos valószínűséggel kerülnek, akkor binomiális eloszláshoz jutunk:

ahol . Viszont a binomiális eloszlás, bizonyos feltételekkel, jól közelíthető Poisson-eloszlással.

2.36. Tétel. Ha úgy, hogy konstans marad, akkor az paraméterű binomiális eloszlás tart a paraméterű Poisson-eloszláshoz.

Bizonyítás. Beírva a 2.24 képletbe -et:

mivel .

Gyakorlatok

  1. Bizonyítsuk be (valószínűségszámítási meggondolásokkal és más úton is), hogy a 2.19 képletbenben szereplő mennyiségekre , ahol az összegzés a számokra terjed ki.

  2. Egy urnában piros és fehér golyó van. Visszatevés nélkül húzunk. Mennyi a valószínűsége, hogy a -edik húzásra jön ki először piros?

  3. Határozzuk meg a binomiális eloszlás maximális tagját!

  4. Egy tóban hal van, ezek közül -et kifogunk, megjelöljük majd visszadobjuk őket. Néhány nap múlva ismét kifogunk halat. Jelölje annak a valószínűségét, hogy ezek között megjelölt hal van. Rögzített esetén melyik -re lesz maximális? (Mivel ismeretlen, viszont a kísérlet elvégzése után ismertté válik számunkra, így az becslésére használható: az ún. maximum-likelihood becslése -nek.)

  5. Egy fiúból és lányból álló társaságot véletlenszerűen két egyenlő létszámú csoportra bontunk. Mennyi a valószínűsége, hogy a csoportokon belül azonos lesz a fiúk és a lányok száma ?

  6. Négy dobókockát feldobunk. Mennyi a valószínűsége, hogy két 1-es és egy 2-es adódik?

  7. Lássuk be az alábbi rekurzív összefüggéseket a hipergeometrikus eloszlásra:

    ahol a hipergeometrikus eloszlás -adik tagja (feltesszük, hogy , ).

  8. Lássuk be a következő rekurzív összefüggéseket a binomiális eloszlásra:

    ahol a binomiális eloszlás -adik tagja.

  9. Oldjuk meg az előző feladatot Poisson-eloszlás esetén is:

    ahol a Poisson-eloszlás -adik tagja.

  10. Ábrázoljuk (számítógépen) a hipergeometrikus, a binomiális és a Poisson-eloszlás oszlopdiagramját különböző paraméterek esetén! Használjuk az előző feladatok rekurzív képleteit!

  11. Ábrázoljuk közös koordinátarendszerben a paraméterű binomiális és az paraméterű hipergeometrikus eloszlást, ahol . Figyeljük meg a konvergenciát, ha .

  12. Ábrázoljuk közös koordinátarendszerben a paraméterű Poisson- és a paraméterű binomiális eloszlást, ahol . Figyeljük meg a konvergenciát, ha .

  13. Egy 10 méteres wolfram szálban átlagosan 5 hiba van. A szálat 6 cm-es darabokra vágjuk, melyekből izzó-spirált készítünk. Várhatóan hány hibátlan izzó-spirált kapunk?

Ellenőrző kérdések

  1. Melyik eloszlás írja le a visszatevés nélküli és melyik a visszatevéses mintavételt?

  2. Milyen feltételek esetén lesz a binomiális eloszlás határeloszlása a Poisson-eloszlás, és milyenek esetén a normális eloszlás?

  3. Mi a kapcsolat a Bernoulli- és a binomiális eloszlás között?

3. fejezet - Valószínűségi változók

3.1. Valószínűségi változók, eloszlások, eloszlásfüggvények

3.1.1. A valószínűségi változó fogalma

Olyan véletlen mennyiségekkel foglalkozunk, melyek nemcsak megszámlálható sok értéket vehetnek fel.

3.1. Példa. Dobjunk egy pontot véletlenszerűen az intervallumra (). Jelölje a pont helyét. Legyen , . -t szeretnénk meghatározni. A valószínűség geometriai kiszámítási módja alapján

ahol a Lebesgue-mérték (azaz az intervallum hossza).

A fenti példában szereplő ún. egyenletes eloszlású valószínűségi változó. Természetes igényként merül fel, hogy minden véletlentől függő mennyiség esetén meg tudjuk mondani, hogy milyen valószínűséggel esik bele egy rögzített intervallumba. Az alábbi (3.1) feltétel ezt garantálja.

Legyen egy valószínűségi mező. A leképezést valószínűségi változónak nevezzük, ha bármely rögzített esetén

A fenti feltétel azt jelenti, hogy azon elemi események halmaza, melyekre , legyen esemény (azaz beszélhessünk a valószínűségről). Ezen egyszerű feltételből már adódik számos fontos tulajdonsága.

A továbbiakban tetszőleges és esetén jelöli a általi inverz képét:

azaz azon -k halmaza, melyeket -be visz. Más jelöléssel

Ezzel a jelöléssel 3.1 éppen a feltételt jelenti.

3.1. Definíció. Legyen most egy tetszőleges halmaz, és legyen részhalmazainak egy -algebrája. Jelölje Borel-halmazait. A leképezést mérhetőnek (pontosabban, -mérhetőnek) nevezzük, ha minden esetén. Speciálisan, egy függvényt Borel-mérhetőnek nevezünk, ha minden esetén, azaz Borel-halmaz inverz képe Borel-halmaz.

3.2. Tétel. Legyen valószínűségi mező. akkor és csak akkor valószínűségi változó, ha mérhető.

A következő tételt is használni fogjuk.

3.3. Tétel. Legyen valószínűségi változó, pedig Borel-mérhető valós függvény. Ekkor is valószínűségi változó.

Bizonyítás. Legyen Borel-halmaz. Ekkor

mivel Borel-halmaz, és valószínűségi változó.

Megjegyezzük, hogy a fentiek alapján -nek minden monoton, illetve folytonos függvénye (pl. , , , ) valószínűségi változó.

3.1.2. Eloszlások

A gyakorlati feladatok zömében a véletlen jelenséget leíró valószínűségi mezőt nem tudjuk megfigyelni, csupán bizonyos vele kapcsolatos mennyiségeket vagyunk képesek mérni.

Például egy műtrágya hatásának vizsgálatakor a kezelt növények bizonyos jellemzőit (a termés mennyisége, annak néhány minőségi jellemzője, ) mérjük. Ami adódik, az a háttérben álló valószínűségi mező egy valószínűségi változó általi képe (a jelen esetben pl. a termés súlyeloszlása). Így gyakran nem az , nem is a , hanem csupán a általi „képe” érdekelhet bennünket.

3.4. Definíció. A valószínűségi változó eloszlásán a

halmazfüggvényt értjük.

3.5. Tétel. eloszlása valószínűség a számegyenes Borel-halmazain (azaz valószínűségi mező).

Bizonyítás. Nyilván , és . Legyenek most diszjunkt Borel-halmazok. Ekkor egymást kizáró események. Így

Tehát -additív is, azaz valószínűség.

3.2. Példa. Diszkrét valószínűségi változók eloszlását könnyen szemléltethetjük súlyokkal. Ha eloszlása , akkor helyezzünk el súlyt az pontba. Egy Borel-halmaz szerinti valószínűsége a benne levő súlyok összege: .

3.1.3. Eloszlásfüggvények

Az eloszlások szemléltetésére és kezelésére az eloszlásfüggvények jelentik az egyik fontos - általánosan alkalmazható - eszközt.

3.6. Definíció. A valószínűségi változó eloszlásfüggvényének az

valós függvényt nevezzük.

Eloszlásfüggvénye minden valószínűségi változónak létezik.

3.3. Példa. A 3.1 Példában szereplő -re , ha , , ha , míg , ha . Ezt nevezzük az intervallumon egyenletes eloszlásnak.

Megjegyezzük, hogy egy valószínűségi változó eloszlásfüggvényének kiszámításakor először „rögzíteni kell az értéket”, és így kiszámítani a valószínűséget, ezután tekinthetjük -et „futó pontnak a számegyenesen”. Legtöbbször szakaszonként más-más képlettel adható meg.

3.4. Példa. Legyen a diszkrét valószínűségi változó eloszlása . Ekkor eloszlásfüggvénye

Azaz eloszlásfüggvénye olyan „lépcsőzetesen” növekvő függvény, mely -ben -t „ugrik”. Például a konstans valószínűségi változó eloszlásfüggvénye: , ha , , ha .

3.1. ábra - A A p=1/2 , n=4 paraméterű binomiális eloszlás eloszlásfüggvénye, A p=1/2 , n=4 paraméterű binomiális eloszlás eloszlásfüggvénye paraméterű binomiális eloszlás eloszlásfüggvénye

A p=1/2 , n=4 paraméterű binomiális eloszlás eloszlásfüggvénye

3.1. Feladat. a) Ábrázoljuk az egyenletes és a Bernoulli-eloszlás eloszlásfüggvényét!

b) Ábrázoljuk a paraméterű binomiális eloszlás eloszlásfüggvényét! (3.1. ábra.)

c) Dobjunk egy pontot véletlenszerűen a intervallumra! Tegyük fel, hogy egy mágnes van a pontban, mely a ledobott pontot magához vonzza, ha az a -ra esik. Jelölje a ledobott pont végső helyét. Ábrázoljuk eloszlásfüggvényét! (3.2. (a) ábra.)

3.2. ábra - Eloszlásfüggvény és inverze

Eloszlásfüggvény és inverze

3.7. Tétel. Egy függvény akkor és csak akkor eloszlásfüggvénye valamely valószínűségi változónak, ha

a) monoton nemcsökkenő;

b) balról folytonos;

c)

Bizonyítás. Legyen a valószínűségi változó eloszlásfüggvénye.

a) Legyen . Ekkor . Így a valószínűség monotonitása miatt .

b) Azt kell belátni, hogy , ha az -hez balról konvergáló sorozat. Legyen az -hez konvergáló, monoton nemcsökkenő sorozat. Ekkor , , olyan növekvő eseménysorozat, melynek uniója . A valószínűség folytonosságából . Speciálisan, . Legyen most az -hez balról konvergáló tetszőleges (nem monoton) sorozat. számot rögzítve, az előzőek alapján létezik úgy, hogy

Mivel , így létezik , amelyre , ha . Az monotonitása és 3.2 miatt

c) monoton növő sorozatra a valószínűség folytonosságából adódik. A nem monoton sorozat esete pedig - a b) részhez hasonlóan - visszavezethető a monoton esetre. ugyanígy bizonyítható.

A másik irány bizonyításához tegyük fel, hogy rendelkezik az a)-c) tulajdonságokkal. Legyen először speciálisan szigorúan monoton és folytonos függvény. Ekkor -nek létezik inverze, mely szintén szigorúan monoton és folytonos. Legyen most a intervallum a Borel-halmazokkal és a Lebesgue-mértékkel ellátva (másszóval -en a valószínűség geometriai kiszámítási módját alkalmazzuk). Legyen . Ekkor mérhető, így valószínűségi változó. eloszlásfüggvénye:

Legyen most tetszőleges a)-c) tulajdonságokkal rendelkező függvény. Definiáljuk „inverzét” az képlettel. (Például a 3.2 (a) ábrán lévő eloszlásfüggvńy ilyen „inverze” a 3.2 (b) ábrán látható.) A szigorúan monoton és folytonos -ek esetére az előzőekben alkalmazott gondolatmenet erre az esetre is átvihető.

3.5. Példa. teljesíti a)-c)-t, tehát eloszlásfüggvény. Ezt paraméterű Cauchy-eloszlásnak nevezzük.

3.8. Tétel. Legyen a eloszlásfüggvénye. Ekkor

a) ;

b) ;

c) .

Bizonyítás. a) .

b) . Így a valószínűség folytonosságából adódik az állítás.

c) az a) és b) következménye.

Megjegyezzük, hogy b) alapján akkor és csak akkor folytonos egy pontban, ha .

3.2. Feladat. Lássuk be, hogy

és

3.1.4. Kvantilisek

Egy valószínűségi változó mediánjának azt a számot nevezzük, melynél nagyobb, illetve kisebb értékeket ugyanolyan valószínűséggel vesz fel.

A számot a valószínűségi változó mediánjának nevezzük, ha

3.9. Tétel. A medián mindig létezik.

Bizonyítás. Legyen a eloszlásfüggvénye. Legyen

Mivel balról folytonos, így . Másrészt, esetén . A valószínűség folytonossága miatt .

3.3. Feladat. Mutassuk meg, hogy az -n egyenletes eloszlás mediánja .

A következő problémák is igen tanulságosak:

3.4. Feladat. a) Lássuk be, hogy ha szigorúan monoton és folytonos eloszlásfüggvény, akkor a medián az egyenlet egyértelmű megoldása!

b) Adjunk példát olyan eloszlásfüggvényre, melyre a medián nem egyértelmű!

c) Lássuk be, hogy a mediánt nem lehetne az megoldásaként definiálni!

d) A medián definiálható a

feltételek egyidejű teljesülésével is.

3.10. Definíció. Legyen . A -kvantilisén azt a számot értjük, melyre

A 0.25-kvantilist alsó kvartilisnek a 0.75-kvantilist felső kvartilisnek nevezzük.

A Cauchy-eloszlás kvartilisei és mediánja a 3.3. ábrán láthatóak.

3.3. ábra - A Cauchy-eloszlás kvartilisei és mediánja

A Cauchy-eloszlás kvartilisei és mediánja

3.6. Példa. a) , ha , , ha (ahol rögzített) képlet által definiált függvény eloszlásfüggvény. Az ehhez tartozó eloszlást exponenciális eloszlásnak nevezzük.

b) Az exponenciális eloszlás -kvantilise: .

3.11. Definíció. -t szimmetrikusnak nevezzük, ha és eloszlása megegyezik.

3.12. Megjegyzés. A ( paraméterű) Cauchy-eloszlás, a -n egyenletes eloszlás szimmetrikus, míg az exponenciális eloszlás nem az.

3.5. Feladat. a) Lássuk be, hogy a szimmetrikus eloszlások mediánja .

b) Milyen alakú a szimmetrikus valószínűségi változók eloszlásfüggvénye?

Gyakorlatok

  1. Az alábbi függvények közül melyek eloszlásfüggvények? Ábrázolja is őket! (Az alábbiakban az adott intervallum „alatt”, és „felette”.)

    1. , ha ,

    2. , ha ,

    3. , ha és valós paraméter,

    4. , ha .

  2. Van-e olyan és eloszlásfüggvény, melyekre minden esetén? Van-e az egyenlőtlenséget teljesítő eloszlásfüggvény-páros?

  3. Adjunk példát két különböző valószínűségi változóra, melyeknek egyforma az eloszlásfüggvényük!

  4. Legyen paraméterű exponenciális eloszlású valószínűségi változó. Számítsuk ki eloszlásfüggvényét!

  5. Legyen egyenletes eloszlású a intervallumban. Határozzuk meg a következő valószínűségi változók eloszlásfüggvényét: a) ; b) ; c) ; d) ; e) ; f) .

  6. Legyen paraméterű exponenciális eloszlású. Lássuk be, hogy -en egyenletes eloszlású!

  7. Legyen eloszlásfüggvénye . Tegyük fel, hogy folytonos típusú, azaz egy intervallumon szigorúan monoton és folytonos, továbbá és . Lássuk be, hogy a -en egyenletes eloszlású! Milyen viszonyban van ez az állítás azzal, hogy és eloszlása megegyezik?

  8. Tegyük fel, hogy és egyenletes eloszlású -en. Számítsuk ki eloszlásfüggvényét! Milyen kapcsolatot látunk az előző feladattal?

  9. Alkatrészek élettartama a megfigyelések szerint közelítőleg exponenciális eloszlású. Tegyük fel, hogy egy izzó élettartama exponenciális eloszlású paraméterrel. Azonban idő után akkor is kicserélik, ha még nem égett ki. Számítsuk ki az ilyen módon „csonkított” élettartamú izzó élettartamának eloszlásfüggvényét!

  10. Legyen paraméterű exponenciális eloszlású. Határozzuk meg azt a legrövidebb intervallumot, melybe 1/2 valószínűséggel esik!

  11. Lássuk be, hogy , ha ; , ha ; , ha , által definiált függvény eloszlásfüggvény (ún. arkusz szinusz eloszlás).

Ellenőrző kérdések

  1. Hogyan definiáljuk az eloszlásfüggvényt?

  2. Igaz-e, hogy minden monoton növekvő függvény eloszlásfüggvény?

3.2. Sűrűségfüggvények

3.2.1. A sűrűségfüggvény fogalma

Az eloszlásoknak egyik jól kezelhető családját alkotják azok, amelyeknek létezik ún. sűrűségfüggvényük.

3.13. Definíció. Legyen eloszlásfüggvénye . Azt mondjuk, hogy eloszlása abszolút folytonos, ha létezik olyan Borel-mérhető függvény, melyre

teljesül. -et sűrűségfüggvényének nevezzük.

3.7. Példa. (1) Ha az -n egyenletes eloszlású, akkor sűrűségfüggvénye , ha , és , ha .

(2) Ha exponenciális eloszlású, akkor sűrűségfüggvénye , ha , és , ha .

(3) Ha (, paraméterű) Cauchy-eloszlású, akkor sűrűségfüggvénye , . (Igazoljuk, hogy a fenti függvények tényleg kielégítik 3.3-at a megfelelő eloszlásfüggvények esetén! Ábrázoljuk a fenti eloszlásfüggvény-sűrűségfüggvény párokat!)

3.4. ábra - A Cauchy-eloszlás sűrűségfüggvénye

A Cauchy-eloszlás sűrűségfüggvénye

Annak valószínűsége, hogy egy valószínűségi változó beleesik egy intervallumba, a sűrűségfüggvénye alatti területnek az fölé eső részével egyenlő. A (, paraméterű) Cauchy-eloszlás esetén ezt a 3.4 ábra szemlélteti. A intervallumba esés valószínűsége a besatírozott rész területével egyenlő.

3.14. Tétel. Ha sűrűségfüggvénye , akkor

a számegyenes minden Borel-halmazára. Speciálisan, sűrűségfüggvénnyel rendelkező esetén bármely esetén.

Az következő tétel ennek következménye:

3.15. Tétel. Az abszolút folytonos eloszlások eloszlásfüggvénye folytonos. Egyetlen diszkrét eloszlásnak sincs sűrűségfüggvénye.

A diszkrét, illetve az abszolút folytonos eloszlások csupán szűk speciális családjai az összes eloszlás halmazának. Az alábbi ún. csonkított Cauchy-eloszlás sem nem diszkrét, sem nem abszolút folytonos. Legyen (, paraméterű) Cauchy-eloszlású. Legyen , ha ( rögzített); , ha ; és , ha . Ekkor eloszlása:

míg -ban eloszlását az sűrűségfüggvény írja le. (A fentiek alapján adjuk meg eloszlásfüggvényét!)

3.16. Tétel. akkor és csak akkor sűrűségfüggvénye valamely valószínűségi változónak, ha Borel-mérhető, nemnegatív (a Lebesgue-mérték szerint majdnem mindenütt) és

Bizonyítás. A tétel pontos bizonyítása a Lebesgue-integrál tulajdonságai alapján könnyen megadható. Az alábbiakban a Riemann-integrálra támaszkodó részleges bizonyítást közlünk.

Legyen (speciálisan) nemnegatív, Riemann-integrálható, továbbá . Ekkor az összefüggés által definiált függvény teljesíti az eloszlásfüggvények jellemző tulajdonságait. A balról folytonosság abból adódik, hogy az integrál mint a felső határ függvénye folytonos. A monoton nemcsökkenőség pedig az nemnegativitásából és az integrál intervallum szerinti additivitásából következik. Végül . Így a fenti -hez tartozó sűrűségfüggvény.

Megfordítva, legyen az -hez tartozó sűrűségfüggvény. Ekkor . Továbbá, . Tehát integrálja minden intervallumon nemnegatív. Ha most még azt is feltesszük (speciálisan), hogy folytonos, akkor a nemnegativitása azonnal adódik.

Megjegyezzük, hogy a gyakorlatban szakaszonként folytonos és mindenütt nemnegatív sűrűségfüggvények fordulnak elő.

3.8. Példa. Legyen , ha és egyébként. Ekkor egy pont kivételével folytonos, így Borel-mérhető. .

Így sűrűségfüggvény.

Az esetek többségében az eloszlásfüggvényt „szakaszonként differenciálva” kapjuk meg a sűrűségfüggvényt.

3.9. Példa. Dobjunk egy pontot véletlenszerűen az egységnégyzetre! Jelölje a pont távolságát a legközelebbi oldaltól. Ekkor eloszlásfüggvénye: , ha ; , ha ; , ha . A sűrűségfüggvény: , ha ; , ha .

3.2.2. A normális eloszlás

A statisztikában alapvető szerepet játszik az ún. normális eloszlás.

A valószínűségi változót normális eloszlásúnak nevezzük, ha sűrűségfüggvénye

alakú, ahol tetszőleges, pedig pozitív valós szám. Azt, hogy és paraméterű normális eloszlású, azaz sűrűségfüggvénye a fenti, jelöli. Ha , akkor -t standard normális eloszlásúnak nevezzük.

A fenti függvény határozatlan integrálja (azaz a megfelelő eloszlásfüggvény) nem adható meg zárt alakban. Az, hogy tényleg sűrűségfüggvény, külön bizonyítást igényel, amit a következő fejezetben végzünk el.

az -re szimmetrikus, harang alakú görbe, mely növelésével egyre „laposabbá” válik. A standard normális eloszlás szimmetrikus. Így eloszlásfüggvényére .

3.17. Tétel. Ha standard normális eloszlású, , akkor eloszlása . Megfordítva, ha , akkor standard normális eloszlású.

Bizonyítás. Legyen . Ekkor -re (ha )

Így sűrűségfüggvénye

A megfordítás bizonyítása hasonlóan történik.

A fenti állítás alapján adódik, hogy normális eloszlású valószínűségi változó lineáris függvénye is normális eloszlású.

3.2.3. Valószínűségi változók függvényei

3.10. Példa. Legyen . Ekkor az valószínűségi változót 1 szabadsági fokú khi-négyzet eloszlásúnak nevezzük (jele: ). eloszlásfüggvénye:

ha . Így sűrűségfüggvénye:

ha , egyébként .

Gyakorlatok

  1. Lássuk be, hogy , , sűrűségfüggvény! Ábrázoljuk a megfelelő eloszlásfüggvényt! Legyen a fenti sűrűségfüggvényű valószínűségi változó. Határozzuk meg az alábbi események valószínűségét: , , .

  2. Az alábbiak közül melyek sűrűségfüggvények? (Az alábbi tartományokon kívül a függvények mindenütt nullák.)

    1. , ,

    2. , ,

    3. , .

  3. Teljesítheti-e két sűrűségfüggvény az feltételt minden esetén?

  4. Legyen paraméterű exponenciális eloszlású. Legyen , ha és , ha . Számítsuk ki eloszlásfüggvényét! Mutassuk meg, hogy abszolút folytonos, és határozzuk meg a sűrűségfüggvényét!

  5. Legyen egyenletes eloszlású -en. Határozzuk meg eloszlás- és sűrűségfüggvényét!

  6. Legyen sűrűségfüggvénye . Lássuk be, hogy akkor és csak akkor teljesül, ha minden esetén (eltekintve egy nulla Lebesgue-mértékű halmaztól)!

  7. Legyen sűrűségfüggvénye . Lássuk be, hogy akkor és csak akkor szimmetrikus, ha szimmetrikus az tengelyre!

  8. Ábrázoljuk a normális eloszlás sűrűségfüggvényét! Határozzuk meg, hogy a görbének hol van maximuma, illetve inflexiós pontja!

  9. Legyen . Határozzuk meg, hogy milyen valószínűséggel esik az intervallumba esetén!

  10. Lássuk be, hogy a legrövidebb olyan intervallum, melybe adott valószínűséggel esik, -re szimmetrikus!

  11. Mutassuk meg, hogy az arkusz szinusz eloszlás sűrűségfüggvénye ().

  12. Az valószínűségi változót -paraméterű Cauchy-eloszlásúnak nevezzük, ha eloszlásfüggvénye

    ahol . Lássuk be, hogy ha paraméterű Cauchy-eloszlású, akkor (ahol ) -paraméterű Cauchy-eloszlású! Lássuk be, hogy sűrűségfüggvénye

Ellenőrző kérdések

  1. Mi a sűrűségfüggvény definíciója?

  2. Mik a sűrűségfüggvény jellemző tulajdonságai?

  3. Van-e sűrűségfüggvénye a binomiális eloszlásnak?

3.3. A várható érték és a szórás

3.3.1. A várható érték definíciója

A diszkrét eloszlások esetén a várható értéket az

képlettel határoztuk meg. Ezt a képletet abszolút folytonos eloszlásokra nem lehet közvetlenül átvinni, hiszen ott . A fenti képlettel analóg formulát akkor kapunk, ha -t „rövid” intervallumokon egyetlen értékkel, pl. az intervallum egyik végpontjával helyettesítjük:

A képletben a -nek olyan középértéke szerepel, amelyben minden részintervallum olyan súllyal kerül számı́tásba, amilyen valószínűséggel abba esik. A fenti középértékeket egyre „pontosabbnak” gondolhatjuk, ha a beosztás részintervallumainak hossza a 0-hoz tart. Így végeredményben a Lebesgue-, illetve a Lebesgue-Stieltjes-féle integrálhoz jutunk:

A várható értékére ténylegesen a 3.6 képletbeni integrálokat használják, azonban a Lebesgue-féle integrálelmélet apparátusa nélkül is lehet értelmezni az abszolút folytonos eloszlások várható értékét. A 3.5 képlet alapján ugyanis

3.18. Definíció. Legyen a valószínűségi változó sűrűségfüggvénye . Ha véges, akkor azt mondjuk, hogy -nek létezik véges várható értéke. Ekkor az

által meghatározott mennyiség létezik és véges. Az számot várható értékének nevezzük.

Megjegyezzük, hogy esetén lehet, hogy (vagy ), de az is előfordulhat, hogy a várható értéket még ilyen tágabb értelemben sem tudnánk definiálni, hiszen -nek mind a pozitív, mind a negatív része lehet egyszerre . Így (ha mást nem mondunk), csak az esetet vizsgáljuk.

Be lehet bizonyítani, hogy a 3.7 képlet (miként 3.4 is) 3.6 speciális esete. Az általunk kimondott tételek az általános esetre fognak vonatkozni (hacsak mást nem állítunk), a bizonyításokat azonban legfeljebb a 3.7 képlettel kiszámítható várható értékre tudjuk elvégezni. A várható érték csak a eloszlásától (de nem magától -től) függ.

3.11. Példa. Legyen egyenletes eloszlású -n. Ekkor

Tehát várható értéke éppen az intervallum középpontja.

A Cauchy-eloszlásnak nem létezik várható értéke. Ezt mutatja be az alábbi példa.

3.12. Példa. Legyen , paraméterű Cauchy-eloszlású. Ekkor

Hasonlóan, . Így határozatlan kifejezés, azaz a Cauchy-eloszlásnak valóban nem létezik várható értéke.

3.3.2. Momentumok

3.19. Tétel. Legyen a valószínűségi változó sűrűségfüggvénye . Legyen Borel-mérhető. Ha , akkor

3.20. Definíció. Legyen . A valószínűségi változó -adik momentumának az mennyiséget nevezzük (amennyiben létezik).

A -adik momentum kiszámítása az előző állítás alapján

szerint történhet, ha sűrűségfüggvénye .

Megjegyezzük, hogy a magasabb rendű momentum végességéből következik az alacsonyabb rendű momentum végessége. Valóban, ha , és , akkor

Az első tag mindig véges (sőt, 1-nél nem nagyobb), a második tag pedig

3.13. Példa. (1) Az exponenciális eloszlás momentumai:

Mivel

így az előző rekurzív képlet alapján, . Speciálisan, .

(2) A standard normális eloszlás momentumai.

Páratlan -ra a fenti integrál értéke 0. Páros -ra (parciálisan integrálva):

Mivel , így , ha páros (itt , azaz szemifaktoriális).

3.3.3. A várható érték tulajdonságai

3.21. Tétel. A várható érték lineáris funkcionál a véges várható értékkel rendelkező valószínűségi változók lineáris terén.

A tétel más szavakkal a következőképp fejezhető ki. Ha várható értéke véges, , akkor várható értéke is véges, és

továbbá, ha és várható értéke véges, akkor várható értéke is véges, és

3.8 a 3.19 Tételből követezik, hiszen várható értéke

A 3.9 képletet speciális esetekben később fogjuk belátni.

3.6. Feladat. 3.8 és 3.9 alapján lássuk be, hogy ha véges várható értékkel rendelkező valószínűségi változók és , akkor

3.22. Tétel. a) Ha , akkor .

b) Ha , akkor .

c) Ha és , akkor .

Bizonyítás. a) Ha , akkor , ha . Így

b) Az a)-ból közvetlenül adódik.

3.3.4. A szórás

A szórás és a szórásnégyzet definíciója és tulajdonságai megegyeznek a diszkrét esetben adottakkal:

3.14. Példa. (1) Legyen egyenletes eloszlású -n. Ekkor

Ezért

Természetes, hogy a szórás az intervallum hosszától függ.

(2) Legyen exponenciális eloszlású. Ekkor

Könnyen látható, hogy minden szórással rendelkező esetén

3.15. Példa. Legyen . Ekkor reprezentálható alakban, ahol .

Innen

továbbá

Így a normális eloszlás paramétereinek jelentése: a várható érték, pedig a szórásnégyzet.

3.23. Tétel. Ha , akkor az valószínűségi változóra és . -t nevezzük standardizáltjának.

Bizonyítás. A várható érték linearitásából és 3.11 képletből adódik.

Gyakorlatok

  1. Számítsuk ki az sűrűségfüggvényű valószínűségi változó várható értékét és szórását!

  2. Számítsuk ki az sűrűségfüggvényű valószínűségi változó várható értékét és szórását!

  3. Adjunk példát olyan valószínűségi változóra, melynek a mediánja nem egyezik meg (illetve megegyezik) a várható értékével!

  4. Legyen eloszlásfüggvénye , ha , , ha és , ha . Számolja ki mediánját és várható értékét!

  5. Legyen , ha és egyébként. Lássuk be, hogy sűrűségfüggvény. Határozzuk meg a megfelelő eloszlásfüggvényt, mediánt, várható értéket és szórásnégyzetet!

Ellenőrző kérdések

  1. Mi a várható érték definíciója?

  2. Mi a szórásnégyzet definíciója?

  3. ?, ?

3.4. Valószínűségi változók együttes eloszlása

3.4.1. Együttes eloszlásfüggvények

és külön-külön vett eloszlása nem határozza meg és együttes viselkedését.

A és valószínűségi változók együttes eloszlásán a sík Borel-halmazaira értelmezett

halmazfüggvényt értjük.

Belátható, hogy valószínűség a sík Borel-halmazain. Az eloszlásnál könnyebben kezelhető az eloszlásfüggvény.

A és valószínűségi változók együttes eloszlásfüggvényén az

által definiált kétváltozós valós függvényt értjük.

Belátható, hogy az eloszlás és az eloszlásfüggvény egymást kölcsönösen meghatározzák.

3.24. Tétel. akkor és csak akkor együttes eloszlásfüggvénye valamely valószínűségi változó párnak, ha

a) mindkét változójában monoton nem csökkenő;

b) mindkét változójában balról folytonos;

c)

d) minden feltételt teljesítő számpárokra.

Bizonyítás. Legyen és együttes eloszlásfüggvénye. Az első három tulajdonság igazolása ugyanúgy történik, mint az egydimenziós esetben. Az pedig könnyen látható, hogy a d)-ben szereplő négytagú összeg éppen , ez pedig nemnegatív. Tehát d) éppen azt fejezi ki, hogy nemnegatív annak valószínűsége, hogy a pár beleessen egy téglalapba.

Teljesítse most az a)-d) tulajdonságokat. Belátható, hogy a téglalapokon a

által definiált függvény kiterjeszthető Borel-halmazaira valószínűséggé. Ezen valószínűséget véve alapul, a , által az -en definiált valószínűségi változó pár eloszlásfüggvénye éppen .

3.25. Megjegyzés. (1) a)-c)-ből nem következik d). Legyen ugyanis , ha , és , ha . Ekkor teljesíti a)-c)-t, de nem teljesíti d)-t (pl. , esetén).

(2) Legyen speciálisan . Ekkor és együttes eloszlásfüggvénye:

Így . Tehát, ha tetszőlegesen nagy értékeket felvehet (pl. exponenciális eloszlású), akkor . Ezért c) második felében mindkét változónak a -be kell tartania ahhoz, hogy 1-hez konvergáljon.

3.26. Tétel. Ha és együttes eloszlásfüggvénye , akkor eloszlásfüggvénye és eloszlásfüggvénye . -t és -t marginális (perem-) eloszlásfüggvényeinek nevezzük.

Bizonyítás. A valószínűség folytonossága miatt.

3.16. Példa. (1) Legyen , ha , és különben. Ekkor eloszlásfüggvény. Ennek belátásához alakítsuk -et szorzattá: , ha . Innen a)-d) azonnal látható. marginális eloszlásai exponenciális eloszlások. , ha , egyébként . Hasonlóan adódik, hogy pedig paraméterű exponenciális eloszlásfüggvény. Nyilván , . (Később látni fogjuk, hogy ez a független és együttes eloszlásfüggvénye.)

Az függvény , esetén a 3.5. ábrán látható.

3.5. ábra - Kétdimenziós exponenciális eloszlásfüggvény

Kétdimenziós exponenciális eloszlásfüggvény

(2) Legyen , ha , egyébként. Ekkor - a 3.25 Megjegyzés (2) része értelmében - a marginális eloszlások paraméterű exponenciálisak. Ezt a példát összevetve az előző példa speciális esetével látjuk, hogy különböző kétváltozós eloszlásfüggvényeknek lehetnek azonos marginálisaik.

3.4.2. Együttes sűrűségfüggvények

3.27. Definíció. A és együttes eloszlását abszolút folytonosnak nevezzük, ha létezik olyan függvény, melyre és együttes eloszlásfüggvénye

alakba írható. -et és együttes sűrűségfüggvényének nevezzük.

3.28. Megjegyzés. (1) Együttes sűrűségfüggvény nem mindig létezik.

(2) Ha a pár együttes sűrűségfüggvénye, akkor

bármely Borel-halmazára.

3.29. Tétel. akkor és csak akkor együttes sűrűségfüggvénye valamely valószínűségi változó párnak, ha

a) mérhető,

b) nemnegatív és

c)

A következő tétel segít a marginális sűrűségfüggvények kiszámításában.

3.30. Tétel. Legyen és együttes sűrűségfüggvénye . Ekkor és is abszolút folytonos, és , valamint sűrűségfüggvénye (az ún. marginális sűrűségfüggvények) az

képletekből határozhatók meg.

Bizonyítás. A következő átalakításokat végezzük:

ahol eloszlásfüggvényét jelöli. Így kielégíti a sűrűségfüggvény definícióját.

3.31. Megjegyzés. Abból, hogy és abszolút folytonos, nem következik, hogy és együttes eloszlása is abszolút folytonos (ez a független esetben teljesül, mint később látjuk). Például, legyen abszolút folytonos, legyen ; ekkor a párnak nincs együttes sűrűségfüggvénye.

3.17. Példa. Legyen véges Lebesgue-mértékű Borel-halmaz (azaz területe véges). Ekkor , ha , egyébként (ahol a területet jelöli) függvény sűrűségfüggvény. Az ilyen sűrűségfüggvényű eloszlást -n egyenletes eloszlásnak nevezzük.

A következő példában a kétdimenziós normális eloszlást mutatjuk be.

3.18. Példa. Legyenek és adott számok, melyekre és . Ekkor az

, sűrűségfüggvényű eloszlást (nem elfajult) kétdimenziós normális eloszlásnak nevezzük. Ahhoz, hogy 3.12 ténylegesen sűrűségfüggvényt határoz meg, be kell látni, hogy .

(Az első lépésben az exponensben teljes négyzetté alakítottunk, a második lépésben pedig kihasználtuk, hogy - alkalmas paraméterű - normális sűrűségfüggvény integrálja 1.) Azt kaptuk, hogy éppen sűrűségfüggvénye. Ezen sűrűségfüggvény szerinti integrálja 1, így .

Melléktermékként azt is kaptuk, hogy a kétdimenziós normális eloszlás marginálisai is normálisak:

ahol és .

Figyeljük meg, hogy a

mátrixok egymás inverzei, ahol . -t és kovarianciájának, a mátrixot pedig a szórásmátrixuknak fogjuk nevezni. Ezek alapján látható, hogy a 3.12 sűrűségfüggvényben az exponensben éppen a szórásmátrix inverzével képezett kvadratikus forma áll, míg a konstans szorzó éppen az inverz determinánsának négyzetgyöke.

3.4.3. A függetlenség

3.32. Definíció. Azt mondjuk, hogy és független valószínűségi változók, ha együttes eloszlásfüggvényük felbomlik a két marginális eloszlásfüggvény szorzatára:

Be lehet látni, hogy ez a feltétel ekvivalens a következővel:

bármely és Borel-halmazra. 3.13 már ténylegesen azt mutatja, hogy a -vel kapcsolatos események függetlenek az -val kapcsolatos eseményektől.

3.7. Feladat. Lássuk be 3.13 alábbi speciális esetét! és akkor és csak akkor függetlenek, ha

ha , .

3.33. Megjegyzés. Ha adott az és eloszlásfüggvény, akkor , , teljesíti a kétdimenziós eloszlásfüggvények jellemző tulajdonságait. Ennek marginálisai éppen és . Így mindig van értelme a következő megfogalmazásnak: „legyenek és független valószínűségi változók és eloszlásfüggvénnyel”.

3.19. Példa. A 3.16 Példa (1) részében szereplő és független (exponenciális eloszlású) valószínűségi változók.

3.34. Tétel. Legyen együttes eloszlása abszolút folytonos. Ekkor és akkor és csak akkor függetlenek, ha együttes sűrűségfüggvényük a marginális sűrűségfüggvények szorzata:

Bizonyítás. (1) Ha 3.14 teljesül, akkor az együttes eloszlásfüggvény

. Tehát és tényleg függetlenek.

(2) Legyen most és független. Tekintsük a , , függvényt. Ez kielégíti a sűrűségfüggvények tulajdonságait. Ennek marginálisai éppen és . Az előző rész értelmében marginálisai függetlenek. A függetlenség definíciója szerint a független esetben a marginálisok egyértelműen meghatározzák az együttes eloszlást. Így a sűrűségfüggvényhez tartozó eloszlás nem lehet más, mint és együttes eloszlása.

3.20. Példa. (1) Lássuk be, hogy ha és abszolút folytonosak és függetlenek, akkor együttes eloszlása is abszolút folytonos! Ennek igazolása lényegében az előző állítás bizonyításának második részével azonos.

(2) Ha a pár egyenletes eloszlású a téglalapon, akkor marginálisai egyenletes eloszlásúak az , illetve intervallumon, és függetlenek.

(3) Ha együttes eloszlása kétdimenziós normális, és kovarianciájuk (azaz a 3.12 képletben), akkor a marginálisok független normális eloszlások.

3.4.4. A kovariancia

A kovariancia és a korrelációs együttható definíciója és tulajdonságai megegyeznek a diszkrét esetben adottakkal. Így részletezni csak a kiszámítási módjukat fogjuk. Először is megjegyezzük, hogy ha mérhető függvény, akkor valószínűségi változó. Ha a pár együttes sűrűségfüggvénye , akkor

feltéve, hogy a fenti egyenlőség egyik oldalán szereplő mennyiség létezik.

Ezért

kiszámítása a

illetve a

összefüggés és az

képlet alapján történhet.

3.35. Megjegyzés. Ha és függetlenek és véges a várható értékük, akkor

Ez abban az esetben, ha létezik együttes sűrűségfüggvény, az

egyenlőség alapján látható be.

3.21. Példa. Legyen és együttes eloszlása normális, 3.12 alatti sűrűségfüggvénnyel. Ugyanúgy eljárva, mint a 3.18 Példában

A belső integrál az eloszlás várható értéke, így az alábbival egyenlő

ahol

Így

Tehát

Ezzel igazoltuk a korábban már jelzett tényt.

Gyakorlatok

  1. Válasszunk egymástól függetlenül két pontot (-t és -t) az egységintervallumban! Lássuk be, hogy a szorzatuk sűrűségfüggvénye , ha és 0 egyébként!

  2. Legyen egyenletes eloszlású az körgyűrűben. Határozzuk meg sűrűségfüggvényét!

  3. Legyenek és azonos eloszlású, független valószínűségi változók eloszlásfüggvénnyel és folytonos sűrűségfüggvénnyel. Lássuk be, hogy sűrűségfüggvénye .

  4. Határozzuk meg sűrűségfüggvényét, ha együttes sűrűségfüggvénye .

  5. Lássuk be, hogy diszkrét valószínűségi változókra a függetlenség és definíciói egybeesnek!

  6. Lássuk be, hogy (ha és véges) abban az esetben, ha létezik -nek és -nak együttes sűrűségfüggvénye!

  7. Dobjunk egy pontot véletlenszerűen egyenletes eloszlás szerint a (0,0), (0,1), (1,0) csúcsokkal rendelkező háromszögre. Jelölje a pont helyzetét. Független-e és ?

Ellenőrző kérdések

  1. A perem eloszlásfüggvények meghatározzák-e az együttes eloszlásfüggvényt?

  2. Mit nevezünk együttes sűrűségfüggvénynek?

  3. Mikor mondjuk, hogy két valószínűségi változó független?

3.5. Valószínűségi vektorváltozók

3.5.1. Többdimenziós eloszlások

Ebben a részben csupán felsoroljuk a valószínűségi vektorváltozók legfontosabb tulajdonságait (bizonyítás helyett az egy-, illetve kétdimenziós esettel való analógiára utalunk), és példákat adunk.

Legyenek valószínűségi változók. Ekkor a vektort valószínűségi vektorváltozónak nevezzük ( a transzponáltat jelöli). A valószínűségi vektorváltozó koordinátáit mindig oszlopvektorba rendezve képzeljük el.

3.36. Definíció. A valószínűségi vektorváltozó eloszlásfüggvényén az

-változós, valós értékű függvényt értjük.

3.37. Tétel. akkor és csak akkor eloszlásfüggvénye valamely valószínűségi vektorváltozónak, ha

a) minden változójában monoton nemcsökkenő;

b) minden változójában balról folytonos;

c) , ; ;

d)

minden esetén, ahol , és az összegzés a 0 és 1 számokból álló összes lehetséges sorozatra terjed ki. (Tehát az 3.15 bal oldalán szereplő összeg számú tagból áll.)

3.8. Feladat. (1) Lássuk be, hogy az 3.15-ben szereplő összeg éppen !

(2) Lássuk be, hogy a marginális eloszlásfüggvények az

képlettel számolhatók ki (ahol kivételével minden a -hez tart) !

A valószínűségi vektorváltozó eloszlását abszolút folytonosnak nevezzük, ha létezik , melyre

. -et sűrűségfüggvényének nevezzük.

Ha a sűrűségfüggvénye, akkor

bármely Borel-halmazra.

3.9. Feladat. Fogalmazzuk meg annak szükséges és elégséges feltételét, hogy sűrűségfüggvény legyen. (Az analógia teljes az egy-, illetve kétdimenziós esettel.)

Belátható, hogy a marginális sűrűségfüggvények az

képlettel nyerhetők (ahol az integrálás nem terjed ki a -adik változóra).

A következő példa ismét az egyváltozós eset analógiája.

3.10. Feladat. Adjuk meg az egyenletes eloszlás definícióját valószínűségi vektorváltozóra!

A valószínűségi vektorváltozó komponenseit (teljesen) függetleneknek nevezzük, ha

. Abszolút folytonos eloszlás esetén a függetlenség ekvivalens

teljesülésével.

3.5.2. A várható érték vektor és a szórásmátrix

Ha egy valószínűségi változókból álló mátrix, akkor várható értéke a komponensei várható értékeiből álló mátrix (ha létezik a komponensek várható értéke):

Így a valószínűségi vektorváltozó várható érték vektora

szórásmátrixán (variancia mátrixán) az alábbi -es mátrixot értjük:

Mivel a mátrix -edik eleme , így -edik eleme :

Részletesebben

A szórásmártix főátlójában a szórásnégyzetei állnak.

A többváltozós várható érték és szórás legalapvetőbb tulajdonságait a következő példa mutatja.

3.11. Feladat. (1) Legyen és (alkalmas méretű) konstans mátrix, ill. vektor. Igazoljuk, hogy

és

(2) Lássuk be, hogy minden szórásmátrix szimmetrikus, pozitív szemidefinit!

3.5.3. A többdimenziós normális eloszlás

3.38. Definíció. Legyenek független standard normális eloszlású valószínűségi változók. Ekkor a valószínűségi vektorváltozót n-dimenziós standard normális eloszlásúnak nevezzük. Mivel , és , így (-dimenziós nullvektor) és (-es egységmátrix). eloszlásának jelölése .

Legyen most , -es mátrix és . Ekkor -et n-dimenziós normális eloszlásúnak nevezzük. A várható érték vektor és a szórásmátrix transzformációs formulája alapján és . eloszlásának jelölése .

Ha , ahol , akkor nem invertálható esetén (azaz, ha ) eloszlása -nél kevesebb dimenziós lineáris sokaságára (konkrétan -re) koncentrálódik, így nem lehet sűrűségfüggvénye. Mivel szórásmátrixa éppen , így pontosan akkor nem invertálható, ha nem invertálható. Ezért -t elfajult n-dimenziós normális eloszlásnak nevezzük, ha nem invertálható.

Invertálható esetén létezik sűrűségfüggvény, ami a következő módon határozható meg.

esetén koordinátái független standard normálisak. Ezért sűrűségfüggvénye db egydimenziós standard normális sűrűségfüggvény szorzata:

ahol .

sűrűségfüggvénye:

ahol .

Ez mutatja, hogy a nem elfajult -dimenziós normális eloszlást meghatározza a várható érték vektora és a szórásmátrixa. (Ez a tény igaz az elfajult esetben is, amit jelöléseinkben már ki is használtunk.)

Tetszőleges normális eloszlás esetén igaz, hogy koordinátái pontosan akkor függetlenek, ha korrelálatlanok. Jelenlegi ismereteink alapján ezt a nem elfajult esetben tudjuk bebizonyítani.

3.12. Feladat. Lássuk be, hogy ha egy (nem elfajult) -dimenziós normális eloszlású valószínűségi vektorváltozó koordinátái korrelálatlanok, akkor függetlenek!

3.5.4. A konvolúció

Legyenek és független valószínűségi változók , illetve sűrűségfüggvénnyel. Ekkor -nak létezik sűrűségfüggvénye, melyet a

képlettel számolhatunk ki. -t és konvolúciójának nevezzük.

3.22. Példa. Számítsuk ki normális eloszlások konvolúcióját! és tőle független esetén sűrűségfüggvénye:

Az exponensben teljes négyzetté alakítunk (a , és jelölésekkel élünk):

Ennélfogva

Az integrandus éppen normális sűrűségfüggvény, így az integrál értéke 1. Ezért pont az sűrűségfüggvénye. Tehát és konvolúciója éppen . Más szóval, független normális eloszlású valószínűségi változók összege is normális eloszlású.

Gyakorlatok

  1. Legyenek , , független, a -en egyenletes eloszlású valószínűségi változók. Lássuk be, hogy .

  2. Legyenek a 3-dimenziós valószínűségi vektorváltozó koordinátái független, eloszlásúak. Lássuk be, hogy hosszának sűrűségfüggvénye

    ha (Maxwell-féle sebességeloszlás).

  3. Legyen normális eloszlású valószínűségi vektorváltozó. Lássuk be, hogy koordinátáinak bármely lineáris kombinációja is normális eloszlású!

Ellenőrző kérdések

  1. Mi a várható érték vektor és mi a szórásmátrix?

  2. Mit nevezünk -dimenziós standard normális eloszlásnak?

3.6. A nagy számok törvényei

3.6.1. A Markov- és a Csebisev-egyenlőtlenség

3.39. Tétel. (Markov-egyenlőtlenség.) Legyen valószínűségi változó és rögzített szám. Ekkor

Bizonyítás. Abszolút folytonos -ra bizonyítunk. Mivel , így sűrűségfüggvényére: , ha .

3.40. Tétel. (Csebisev-egyenlőtlenség.) Tegyük fel, hogy a valószínűségi változónak véges a szórása. Ekkor rögzített szám esetén

Bizonyítás. Legyen , . Alkalmazzuk a Markov-egyenlőtlenséget.

3.6.2. A nagy számok gyenge törvényei

Ebben a részben valószínűségi változók egy sorozatát fogja jelölni, , , pedig az ún. részletösszegek sorozatát. A nagy számok gyenge törvénye az alkalmasan normált sorozat sztochasztikus konvergenciáját állítja.

3.41. Definíció. Azt mondjuk, hogy az valószínűségi változó sorozat sztochasztikusan konvergál az valószínűségi változóhoz, ha esetén

Ennek jelölésére a formulát használjuk. A sztochasztikus konvergenciát más néven valószínűségben való (mértékben való) konvergenciának is hívják.

3.42. Tétel. Legyenek páronként független, azonos eloszlású valószínűségi változók. Tegyük fel, hogy . Jelölje a közös várható értéket. Ekkor

Bizonyítás. A Csebisev-egyenlőtlenség alapján -ra

ha . (A számolás során kihasználtuk, hogy páronként független összeadandók esetén a szórásnégyzet additív.)

A nagy számok gyenge törvényének jelentése a következő. úgy tekinthető, mint egy valószínűségi változóra vonatkozó független megfigyeléssorozat (hisz -k azonos eloszlásúak). Így a megfigyelések átlaga, míg az várható érték az elméleti átlag. Tehát a megfigyelések átlaga konvergál az elméleti átlaghoz. A törvény ,,gyenge” jelzője azt jelenti, hogy a konvergencia ,,csak” sztochasztikus, azaz ,,nagy esetén kicsi a valószínűsége, hogy nagyon eltérjen -től”.

Megjegyezzük, hogy Hincsin bebizonyította, hogy a tétel érvényben marad akkor is, ha helyett csupán a feltételt követeljük meg.

3.6.3. A nagy számok Bernoulli-féle törvénye

Tekintsünk egy kísérletet és abban egy eseményt, legyen . Ismételjük meg -t -szer egymástól függetlenül. Jelölje az relatív gyakoriságát. Ekkor éppen alakba írható, ha , ahol jelenti az bekövetkezései számát a kísérlet -edik végrehajtásában. A -k független Bernoulli-eloszlásúak, , . Ez pont a 3.42 Tételbeni szituáció speciális esete. Így

hisz . Az sorozat első 200 tagjának viselkedése ( esetén) a 3.6. ábrán látható.

3.6. ábra - A nagy számok Bernoulli-féle törvénye

A nagy számok Bernoulli-féle törvénye

3.16-ot a nagy számok Bernoulli-féle törvényének nevezik. Ennek jelentése az, hogy a relatív gyakoriság (sztochasztikusan) konvergál a valószínűséghez. Jelentősége pedig az, hogy a valószínűségszámítás általunk ismert modelljében (tételként) megjelenik az a törvényszerűség, amelyet a modell felállításakor mint empirikus tényt vettünk figyelembe az axiómák alkalmas megválasztásához.

3.6.4. A nagy számok erős törvényei

Az erős törvények ún. majdnem biztos (más szóval majdnem mindenütti, ill. 1 valószínűséggel való) konvergenciát mondanak ki.

3.43. Definíció. Azt mondjuk, hogy az valószínűségi változó sorozat majdnem biztosan konvergál az valószínűségi változóhoz, ha , ha , ahol .

Tehát a majdnem biztos konvergencia - egy nulla valószínűségű halmaz kivételével - pontonkénti konvergenciát jelent. Ezen konvergencia más elnevezése 1 valószínűséggel való, ill. (mértékelméleti nyelven) majdnem mindenütti konvergencia.

3.7. ábra - Sztochasztikus konvergencia a 3.23. példában

Sztochasztikus konvergencia a 3.23. példában

3.23. Példa. Olyan sorozatot konstruálunk, mely sztochasztikusan konvergál, majdnem biztosan azonban nem. Legyen a intervallum a Borel-halmazokkal és a Lebesgue-mértékkel ellátva. Legyen , ; , ha és 0 egyébként; , ha , és 0 egyébként; , ha és 0 egyébként, , , ha és 0 egyébként, Mivel azon intervallum hossza, ahol , 0-hoz tart, így sztochasztikusan. Viszont az az intervallum, ahol , ,,végtelen sokszor visszatér” bármely pont fölé, így a sorozatban végtelen sok 0, és végtelen sok 1 van. Ezért nem konvergens, . A sorozat 4 tagja a 3.7. ábrán látható.

Megjegyezzük, hogy a majdnem biztos konvergenciából viszont következik a sztochasztikus konvergencia. Ezek alapján az erős törvények ténylegesen erősebb konvergenciát mondanak ki, mint a gyengék. A Kolmogorov-féle erős törvény az alábbi.

3.44. Tétel. Legyenek (teljesen) független, azonos eloszlású valószínűségi változók, tegyük fel, hogy . Ekkor majdnem biztosan, ahol (és ).

Az utóbbi időben derült ki, hogy nemcsak a gyenge törvény, hanem az erős is érvényes csupán páronkénti (azaz nem teljes) függetlenséget feltételezve. Azaz az alábbi tétel mind a Hincsin-féle, mind a Kolmogorov-féle törvényt maga után vonja.

3.45. Tétel. (Etemadi tétele.) Legyenek páronként független, azonos eloszlású valószínűségi változók. Tegyük fel, hogy . Ekkor

majdnem biztosan, ahol (és ).

A Kolmogorov-féle erős törvény alábbi általánosítása Marcinkiewicztől származik.

Legyenek független, azonos eloszlású valószínűségi változók. Tegyük fel, hogy , ahol , és , ha . Ekkor

majdnem biztosan. A fenti tétel bizonyítása (miként a jelen szakasz további tételeié is) meghaladja a jegyzet kereteit.

A Marcinkievicz-féle törvényből úgy tűnik, hogy ha -nek ,,elég magas momentuma létezik”, akkor ,,alkalmasan normálva” majdnem biztosan 0-hoz tart. Azonban -nél a törvényszerűség jellegében változás történik: ha , akkor nem egy konstanshoz tart, hanem normális eloszláshoz (eloszlásban). Ez már az ún. központi határeloszlás-tétel ,,vadászterülete” (a -nel való normálás miatt).

3.8. ábra - Integrál közelítő kiszámítása

Integrál közelítő kiszámítása

3.24. Példa. A nagy számok törvényének alkalmazásaként bemutatjuk, hogy hogyan lehet integrálokat az ún. Monte Carlo-módszerrel kiszámolni. Legyen . Határozzuk meg értékét. Ebből a célból tekintsük a független, -en egyenletes eloszlású valószínűségi változók sorozatát. Ekkor , független, az egységnégyzeten egyenletes eloszlású kétdimenziós valószínűségi vektorváltozók. Legyen

Ekkor -k függetlenek és azonos eloszlásúak. Továbbá

(a valószínűség geometriai kiszámítási módja alapján). A nagy számok erős törvénye miatt

majdnem biztosan. A fentiek alapján a , sorozat megfigyelésével kiszámíthatjuk -et. Az integrál közelítő értéke a függvény görbe alá eső pontok száma osztva az összes pontok számával. Lásd a 3.8. ábrát!

Gyakorlatok

  1. Legyen nemcsökkenő függvény. Legyen nemnegatív, korlátos valószínűségi változó: . Lássuk be, hogy esetén

    (Ez a Markov-egyenlőtlenség megfordításának tekinthető.) Legyen korlátos valószínűségi változó: . Igazoljuk, hogy

    (Ez a Csebisev-egyenlőtlenség megfordítása.)

  2. Legyen binomiális eloszlású és paraméterrel. Adjunk alsó becslést a valószínűségre a Csebisev-egyenlőtlenség felhasználásával.

  3. Legyenek független, standard normális eloszlásúak. Adjuk meg eloszlását. A Csebisev-egyenlőtlenség felhasználásával adjunk felső becslést a valószínűségre.

  4. Számítsuk ki az értékét a 3.24. példában megadott módszerrel.

Ellenőrző kérdések

  1. Mit mond ki a Markov- és a Csebisev-egyenlőtlenség?

  2. Mi a különbség a nagy számok erős és gyenge törvényei között?

  3. Mit állít a nagy számok Kolmogorov-féle erős törvénye?

  4. Mit állít a nagy számok törvénye a relatív gyakoriságokról?

3.7. A központi határeloszlás-tétel

3.7.1. A határeloszlás-tétel lokális alakja Bernoulli-féle kísérletsorozatra

Legyenek független, azonos Bernoulli-eloszlású valószínűségi változók: , , . Legyen , , az ún. -edik részletösszeg. Ekkor binomiális eloszlású, , .

3.13. Feladat. Ábrázoljuk közös koordinátarendszerben az paraméterű binomiális eloszlást és az paraméterű normális eloszlás sűrűségfüggvényét! (A 3.9. ábrán a eset látható.) Ugyanezt végezzük el a binomiális eloszlás standardizáltjával és a standard normális eloszlással! Mit tapasztalunk, ha nagy ( rögzített)?

3.9. ábra - A binomiális eloszlás közelítése normálissal

A binomiális eloszlás közelítése normálissal

A központi határeloszlás-tétel azt állítja, hogy ,,közelítőleg” normális eloszlású, ha ,,nagy”. A pontosabb megfogalmazáshoz emlékeztetünk arra, hogy a jelölés alatt azt értjük, hogy . Továbbá, azt jelenti, hogy . Jelölje eloszlását: , .

3.46. Tétel. Legyen . Ekkor azon -kra, melyekre , egyenletesen teljesül a következő:

A tétel állítása részletesebben kifejtve:

ha , ahol

Megjegyezzük, hogy 3.17 jobb oldalán (ill. 3.18-ben is) sűrűségfüggvényének a -helyen vett értéke szerepel. 3.17 jelentése tehát az, hogy a ,,farkak” kivételével a binomiális eloszlás egyenletesen közelíthető normális eloszlással.

3.14. Feladat. A binomiális eloszlás standardizáltjára mutassuk meg, hogy

ahol nemnegatív egész. Innen

jelöléssel

Mit jelent ez utóbbi a standardizált binomiális eloszlás és a standard normális eloszlás sűrűségfüggvénye alatti terület viszonyára vonatkozóan?

3.7.2. A határeloszlás-tétel integrál alakja Bernoulli-féle kísérletsorozatra

Az előzőek alapján természetesnek tűnik, hogy az paraméterű binomiális eloszlásfüggvény közel van eloszlásfüggvényéhez. Ez igaz is, és pontos bizonyítása az alábbi tételből (és a szakasz végi gyakorlatokból) fog adódni. Szemléltetése pedig a 3.10. ábrán látható a esetben.

A binomiális eloszlás standardizáltjának eloszlásfüggvénye az egész számegyenesen egyenletesen konvergál a standard normális eloszlás eloszlásfüggvényéhez. Ez részletesebben kifejtve az alábbit jelenti.

3.47. Tétel. Jelölje a standard normális eloszlásfüggvényt:

pedig jelölje a binomiális eloszlás standardizáltjának eloszlásfüggvényét:

ahol az összegzés olyan -ekre értendő, melyekre argumentumában nemnegatív egész áll. Ekkor

A 3.46 és 3.47 tételek az ún. Moivre-Laplace-tétel változatai.

3.10. ábra - A binomiális eloszlásfüggvény közelítése normálissal

A binomiális eloszlásfüggvény közelítése normálissal

3.15. Feladat. Vezessük le a nagy számok gyenge törvényét a Moivre-Laplace-tételből!

3.7.3. Valószínűségeloszlások konvergenciája

A majdnem biztos, ill. a sztochasztikus konvergencia valamilyen értelemben maguknak a valószínűségi változóknak a ,,közelségén” alapul, míg a most bevezetendő konvergencia csupán az eloszlások ,,közelségén”.

3.48. Definíció. Azt mondjuk, hogy az eloszlásfüggvény sorozat gyengén konvergál az eloszlásfüggvényhez, ha

teljesül minden olyan pontban, ahol folytonos.

Azt mondjuk, hogy a valószínűségi változó sorozat eloszlásban konvergál a valószínűségi változóhoz, ha gyengén konvergál -hez.

3.11. ábra - Eloszlásfüggvények konvergenciája

Eloszlásfüggvények konvergenciája

3.25. Példa. (1) Ha egyenletes eloszlású a intervallumon, és , akkor eloszlásban tart -hez, de , azaz az ugrási helyén nem áll fenn az eloszlásfüggvények konvergenciája. és a 3.11 ábra (a) és (b) részén látható. Másrészt, ha egyenletes eloszlású -en, akkor eloszlásban tart -hez, és minden esetén.

(2) Ha egyenletes eloszlású -en, akkor (eloszlásfüggvényét -nel jelölve)

Azaz eloszlásfüggvények határértéke nem feltétlenül eloszlásfüggvény. és a 3.11 ábra (c) és (d) részén látható.

3.7.4. A központi határeloszlás-tétel az általános esetben

A matematikai statisztika módszereinek jelentős része arra a feltevésre épül, hogy a megfigyelt mennyiség normális eloszlású. Azt, hogy a megfigyelt mennyiségek igen gyakran (közelítőleg) normális eloszlást követnek, egyrészt a tapasztalat mutatja, másrészt elméletileg a központi határeloszlás-tételek támasztják alá.

3.49. Tétel. Legyenek független, azonos eloszlású valószínűségi változók, . Tegyük fel, hogy véges és pozitív, és legyen . Ekkor

.

A 3.19 képlet jelentése: standardizáltjának eloszlásfüggvénye a standard normális eloszlásfüggvényhez tart esetén. Megjegyezzük, hogy a központi határeloszlás tétel általánosabb alakjai a fentinél jóval gyengébb feltételek esetén állítják, hogy valószínűségi változók összegei normális eloszláshoz tartanak.

3.7.5. A központi határeloszlás-tétel lokális alakja

3.50. Tétel. Legyenek független, azonos eloszlású valószínűségi változók, . Tegyük fel, hogy véges és pozitív és . Jelölje az standardizáltját. Tegyük fel, hogy -nek létezik sűrűségfüggvénye, mely szakaszonként folytonos. Jelölje az sűrűségfüggvényét (amely a feltételek miatt létezik). Tegyük fel, hogy valamely -ra korlátos. Ekkor

és a konvergencia -ben egyenletes.

Tehát a standardizált részletösszegek sűrűségfüggvénye a standard normális sűrűségfüggvényhez konvergál. A tétel bizonyítása megtalálható pl. Rényi (1981) könyvében.

3.7.6. A központi határeloszlás-tétel szemléltetése

Legyenek független, azonos eloszlású valószínűségi változók, , , . A központi határeloszlás-tétel alapján, nagy esetén közelítőleg standard normális eloszlású. Tehát annak a valószínűsége, hogy valamely intervallumba esik, nagyjából annyi, mint a függvény alatti terület -n. Ezt kísérletileg úgy láthatjuk, hogy -et sokszor megfigyeljük, és meghatározzuk ezen mennyiség -be való esésének relatív gyakoriságát.

Ennek számítógépes szimulációval való szemléltetése a következő. Generáljuk (nagy -re) -et. Határozzuk meg konkrét értékét. Ezt ismételjük sokszor. Ábrázoljuk az egyes részintervallumokba esés (relatív) gyakoriságát.

3.12. ábra - A standardizált bolyongás

A standardizált bolyongás

Konkrétan a szimmetrikus véletlen bolyongás esetére készítettük el a 3.12. ábrát. Most , így az -et kell ábrázolni. A sorozat (töröttvonallal összekötve) látható az ábrán. Az értékét 49-nek választottuk (hogy a bolyongás lefolyása jól látható legyen), a becsapódás helyén pedig 1 egységnyi súlyt helyeztünk el.

Ezután egy hosszúságú kísérletsorozatot sokszor (konkrétan 300-szor) megismételtünk. A sok hosszú bolyongás becsapódásai az -nál lévő függőleges falon megközelítőleg a haranggörbét domborítják ki (3.13 ábra).

3.13. ábra - A standardizált bolyongás ismétléseinek eredménye

A standardizált bolyongás ismétléseinek eredménye

Gyakorlatok

  1. A központi határeloszlás-tétel lokális alakjából (azaz a 3.50 Tételből) vezessük le annak integrál alakját (azaz a 3.49 Tételt).

  2. Legyenek független, azonos eloszlású valószínűségi változók, . Jelölje az eloszlásfüggvényét, pedig az eloszlásfüggvényét. Bizonyítsuk be, hogy

    minden valós számra. Azaz eloszlása a neki megfelelő várható értékű és szórású normálishoz van közel. A bizonyításhoz használjuk a 3.49 Tételt és azt a tényt, hogy az eloszlásfüggvények konvergenciája egyenletes, ha a határ-eloszlásfüggvény folytonos.

  3. Legyenek független, a -en egyenletes eloszlású valószínűségi változók, . A központi határeloszlás-tétel és a normális eloszlás táblázata segítségével adjunk közelítést a valószínűségre.

Ellenőrző kérdések

  1. Miben különbözik a nagy számok törvénye és a központi határeloszlás-tétel?

  2. Mondja ki a központi határeloszlás-tételt!

4. fejezet - Nevezetes abszolút folytonos eloszlások

4.1. Az egyenletes eloszlás

4.1.1. Az egyenletes eloszlás jelentése

Ha egy véges intervallumra úgy dobunk egy pontot, hogy az intervallum bármely részintervallumára annak hosszával arányos valószínűséggel essen, akkor a pont -koordinátája egyenletes eloszlású.

A valószínűségi változót az intervallumon egyenletes eloszlásúnak nevezzük, ha eloszlásfüggvénye

Az egyenletes eloszlás sűrűségfüggvénye

egyébként .

4.1. ábra - Az egyenletes eloszlás eloszlásfüggvénye

Az egyenletes eloszlás eloszlásfüggvénye

4.2. ábra - Az egyenletes eloszlás sűrűségfüggvénye

Az egyenletes eloszlás sűrűségfüggvénye

4.1.2. Az egyenletes eloszlás jellemző mennyiségei

A várható érték:

A szórásnégyzet:

4.3. ábra - 2, ill. 3 egyenletes eloszlás konvolúciója

2, ill. 3 egyenletes eloszlás konvolúciója

A 4.3. ábra (a) részén 2, (b) részén pedig 3 független, -en egyenletes eloszlású valószínűségi változó összegének sűrűségfüggvénye látható. A konvolúció simító hatása jól megfigyelhető.

4.1.3. A többdimenziós egyenletes eloszlás

Legyen véges Lebesgue-mértékű Borel-halmaz (azaz területe, térfogata, véges). Dobjunk -re egy pontot úgy, hogy a bármely Borel-részhalmazára annak Lebesgue-mértékével arányos valószínűséggel essen, akkor a pont helyvektora egyenletes eloszlású -n.

Ekkor sűrűségfüggvénye , ha , egyébként (ahol a Lebesgue-mértéket jelöli). Az ilyen sűrűségfüggvényű eloszlást nevezzük -n egyenletes eloszlásnak.

Gyakorlatok

  1. Számítsuk ki az -n egyenletes eloszlás centrált momentumait!

  2. Számítsuk ki 2, ill. 3 független, -en egyenletes eloszlású valószínűségi változó összegének sűrűségfüggvényét!

  3. Igazoljuk, hogy ha és , akkor az -en egyenletes eloszlás a -re koncentrálódó (diszkrét) eloszláshoz konvergál! Igazoljuk, hogy ha és , akkor az -en egyenletes eloszlás nem konvergál semmilyen eloszláshoz!

  4. Legyen egyenletes eloszlású az téglalapon. Határozzuk meg együttes eloszlásfüggvényét! Ábrázoljuk is!

  5. Legyen egyenletes eloszlású -n. Milyen esetén lesz és független?

Ellenőrző kérdések

  1. Mi az egyenletes eloszlás definíciója?

  2. Mi az egyenletes eloszlás eloszlásfüggvénye, sűrűségfüggvénye, várható értéke?

4.2. Az exponenciális eloszlás

4.2.1. Az exponenciális eloszlás definíciója

A valószínűségi változót paraméterű exponenciális eloszlásúnak nevezzük, ha eloszlásfüggvénye:

Itt rögzített.

4.4. ábra - Az exponenciális eloszlásfüggvény

Az exponenciális eloszlásfüggvény

Az exponenciális eloszlás élettartamok és várakozási idők eloszlásaként lép fel. Az exponenciális eloszlás és a vele kapcsolatos más eloszlások a sorbanállás-elméletben és a megbízhatóság-elméletben használatosak.

Az exponenciális eloszlás sűrűségfüggvénye:

4.5. ábra - Az exponenciális sűrűségfüggvény

Az exponenciális sűrűségfüggvény

4.2.2. Az exponenciális eloszlás jellemző mennyiségei

A momentumok:

Speciálisan, a várható érték és a szórásnégyzet:

4.2.3. Az exponenciális eloszlás tulajdonságai

Az exponenciális eloszlás „örökifjú”:

A fenti egyenlőség jellemzi is az exponenciális eloszlást az abszolút folytonos eloszlások között.

4.1. Tétel. Ha független, paraméterű exponenciális eloszlású, akkor -edrendű, paraméterű -eloszlású, azaz sűrűségfüggvénye:

Ezt a speciális -eloszlást Erlang-eloszlásnak is nevezik.

Bizonyítás. Ennek igazolása indukcióval történhet. esetén igaz a képlet, hiszen éppen az exponenciális sűrűségfüggvény. Az felbontást használva (és feltéve, hogy sűrűségfüggvénye ) sűrűségfüggvénye a konvolúciós képlet alapján:

4.2.4. A Laplace-eloszlás

A valószínűségi változót paraméterű Laplace-eloszlásúnak nevezzük, ha sűrűségfüggvénye:

ahol rögzített.

A Laplace-eloszlás más neve: kétoldali exponenciális eloszlás. A Laplace-eloszlás várható értéke és szórásnégyzete:

Gyakorlatok

  1. Egy élettartamot jelentő valószínűségi változót örökifjúnak nevezünk, ha

    esetén (azaz, ha a életkort elérte, akkor ugyanolyan eséllyel él még s ideig, mintha éppen akkor született volna).

    1. Lássuk be, hogy az exponenciális eloszlás örökifjú!

    2. Lássuk be, hogy ha örökifjú, akkor exponenciális eloszlású!

  2. Határozzuk meg a Laplace-eloszlás eloszlásfüggvényét!

  3. Ábrázoljuk a Laplace-eloszlás eloszlás- és sűrűségfüggvényét!

  4. Számítsuk ki a Laplace-eloszlás várható értékét és szórásnégyzetét!

Ellenőrző kérdések

  1. Mi az exponenciális eloszlás sűrűségfüggvénye?

  2. Mit jelent az „örökifjúság”?

4.3. A normális eloszlás

4.3.1. A normális eloszlás definíciója

A normális eloszláson alapul a statisztika klasszikus elméletének túlnyomó része. A valószínűségi változót normális eloszlásúnak nevezzük, ha sűrűségfüggvénye:

ahol , .

Jelölése: . Igazolnunk kell, hogy 4.1 valóban sűrűségfüggvényt határoz meg.

4.2. Tétel. A 4.1 alatti függvény sűrűségfüggvény.

Bizonyítás. nyilvánvaló. mérhető, mivel folytonos. Továbbá helyettesítéssel

Számítsuk ki -et. Kettős integrállá alakítással

, helyettesítéssel polárkoordinátákra térünk át (a transzformáció Jacobi-determinánsa ) :

Így 4.2 alapján , azaz tényleg sűrűségfüggvény.

grafikonja az ún. haranggörbe (Gauss-görbe). Az függvény -re szimmetrikus, szigorúan monoton növekvő a intervallumon. -ban -nek inflexiós pontja van. -ben -nek maximumhelye van, a maximum értéke . növelésével a harang alakú görbe „laposabbá” válik, csökkentésével pedig „csúcsosabbá”. A 4.6. ábrán normális sűrűségfüggvények láthatóak esetén. A csúcsosabbnál , a folytonos vonallal ábrázoltnál .

4.6. ábra - Normális sűrűségfüggvények különböző szórásokra

Normális sűrűségfüggvények különböző szórásokra

4.7. ábra - Hisztogram és normális sűrűségfüggvény

Hisztogram és normális sűrűségfüggvény

A normális eloszlásfüggvényre nincs zárt formula, de vannak jó numerikus közelítések.

A normális eloszlás a mérési hibák tipikus eloszlása. Ez a gyakorlatban azt jelenti, hogy ha a mérési eredmények oszlopdiagramját (pontosabban szólva, sűrűséghisztogramját) felrajzoljuk, akkor arra általában jól illeszthető haranggörbe (lásd a 4.7 ábrát).

4.3.2. A standard normális eloszlás

Ha , akkor -at standard normális eloszlásúnak nevezzük. A 4.8 és a 4.9 ábrán a standard normális sűrűségfüggvény, ill. eloszlásfüggvény látható. Az ábrákon bejelöltük a 0.025 kvantilist: és a 0.975 kvantilist: . Ez azt jelenti, hogy a sűrűségfüggvény alatt besatírozott két rész mindegyike 0.025 területű. Továbbá, hogy az eloszlásfüggvény értéke a helyen 0.025, az helyen pedig 0.975.

4.8. ábra - A standard normális sűrűségfüggvény

A standard normális sűrűségfüggvény

4.9. ábra - A standard normális eloszlásfüggvény

A standard normális eloszlásfüggvény

A páratlan rendű momentumok nullával egyenlőek, a párosak:

4.3.3. A normális eloszlás jellemzői

Ha és , akkor . Speciálisan, standardizáltja standard normális eloszlású: . Másrészt minden normális eloszlás megkapható a standard normális eloszlásból: ha , akkor teljesül.

A várható érték:

A páratlan rendű centrált momentumok nullával egyenlőek, a párosak:

Speciálisan, a szórásnégyzet:

Ha , , és és függetlenek, akkor

Megemlítjük a standard normális eloszlásfüggvény egy egyszerű approximációját (lásd: Johnson, Kotz (1970), 1. kötet, 55. oldal). Jelölje a standard normális eloszlásfüggvényt. Ekkor

ha , ahol , , , . A közelítés hibája kisebb -nél.

Ha , akkor . Azaz a normális eloszlású valószínűségi változó a saját várható értéke körüli intervallumon kívülre elenyésző (kb. 0.0028) valószínűséggel esik. Ez az ún. -szabály (három szigma szabály), amelyet az ipari minőségellenőrzésben rutinszerűen használnak.

Gyakorlatok

  1. Bizonyítsuk be, hogy normális eloszlású valószínűségi változó lineáris függvénye is normális eloszlású! Alkalmazzuk az eloszlásfüggvény definícióját.

  2. Határozzuk meg a normális eloszlás momentumait a standard normális eloszlásra visszavezetve!

  3. A sűrűségfüggvények konvolúciós formulájával bizonyítsuk be, hogy normális eloszlások konvolúciója is normális eloszlás.

Ellenőrző kérdések

  1. Mi a normális eloszlás sűrűségfüggvénye?

  2. Mi a -szabály?

4.4. A többdimenziós normális eloszlás

A többdimenziós normális eloszlás alapvető szerepet játszik a statisztikában, így itt részletesen tárgyaljuk.

4.4.1. A többdimenziós standard normális eloszlás

Legyenek független, standard normális eloszlású valószínűségi változók. Ekkor a valószínűségi vektorváltozót -dimenziós standard normális eloszlásúnak nevezzük.

Mivel , és , így (-dimenziós nullvektor) és (-es egységmátrix). eloszlásának jelölése . Ha a dimenzióra is utalni akarunk, akkor .

4.3. Tétel. sűrűségfüggvénye

ahol .

Bizonyítás. Mivel koordinátái független, standard normálisak, ezért sűrűségfüggvénye db egydimenziós standard normális sűrűségfüggvény szorzata:

4.4.2. A többdimenziós normális eloszlás általános alakja

4.4. Definíció. Legyen , -es mátrix és . Ekkor -et -dimenziós normális eloszlásúnak nevezzük.

Az valószínűségi változókat együttesen normális eloszlásúaknak nevezzük, ha -dimenziós normális eloszlású.

A fenti eloszlása -nek az lineáris sokaságára koncentrálódik.

A várható érték vektor és a szórásmátrix transzformációs formulája alapján és .

eloszlásának jelölése vagy .

Minden és -es szimmetrikus, pozitív szemidefinit mátrix esetén létezik eloszlás. A kívánt valószínűségi vektorváltozó , amennyiben .

4.5. Tétel. -nek akkor és csak akkor van sűrűségfüggvénye, ha invertálható. Ekkor sűrűségfüggvénye:

.

Bizonyítás. Mivel , így pontosan akkor nem invertálható, ha nem invertálható. Nem invertálható esetén eloszlása -nek -nél kevesebb dimenziós lineáris sokaságára koncentrálódik, így nem lehet sűrűségfüggvénye. Invertálható esetén a sűrűségfüggvény transzformációval határozható meg.

Ha nem invertálható, -t elfajult -dimenziós normális eloszlásúnak nevezzük.

Az -dimenziós normális eloszlású valószínűségi vektorváltozó koordinátáinak bármely lineáris kombinációja egydimenziós normális eloszlású.

Ennek igazolására legyen , ahol standard normális, és legyen . Ekkor , ahol a vektor -edik koordinátája. Itt az összeadandók független, egydimenziós normálisak, így az összeg is egydimenziós normális.

A fenti megjegyzésben és a továbbiakban az egyetlen pontra koncentrált eloszlást is (elfajult) normális eloszlásnak tekintjük.

4.4.3. A többdimenziós normális eloszlás szemléltése

Könnyen látható, hogy a (nem elfajult) kétdimenziós standard normális eloszlás sűrűségfüggvényének képe éppen egy harang alakú felület (egy haranggörbe saját tengelye körüli megforgatottja).

Általában az nem elfajult kétdimenziós normális eloszlás sűrűségfüggvénye a fenti harang „eltorzítottja”. Középpontja -ben van, szintvonalai pedig ellipszisek. Egy-egy ilyen ellipszis középpontja -ben van, tengelyei pedig és irányúak és hosszuk -gyel, ill. -vel arányos. Itt és a mátrix , ill. sajátértékekhez tartozó sajátvektorai. Ez a tény az

egyenlet megoldásából következik. Ebből ugyanis a felbontás - ahol az ortonormált sajátvektorok mátrixa, pedig a sajátértékek diagonális mátrixa - alapján

adódik. Itt és az vektor két koordinátája az és alkotta bázisban.

A 4.10. és 4.11. ábrához és

választással éltünk. Így sajátvektorai

és

sajátértékeki pedig és .

4.10. ábra - A kétdimenziós normális sűrűségfüggvény

A kétdimenziós normális sűrűségfüggvény

4.11. ábra - Koncentráció ellipszisek

Koncentráció ellipszisek

A 4.10 ábrán a sűrűségfüggvény harangja és annak ellipszis alakú szintvonalai láthatóak. A 4.11 ábrán újra a szintvonalak láthatóak, de most a fenti normális eloszlásból generált 400 véletlen számmal együtt. Ezen 400 pont jól mutatja a fenti ellipszisek koncentráció ellipszis elnevezésének a jogosságát: a normális eloszlású valószínűségi vektorváltozó a belső ellipszisektől kifelé haladva egyre kisebb valószínűséggel esik.

Térjünk rá nem elfajult háromdimenziós normális eloszlás szemléltetésére. Ekkor azon pontok, amelyeken a sűrűségfüggvény azonos értékeket vesz fel, egy-egy ellipszoidon helyezkednek el. Ezek a koncentráció ellipszoidok. Egy-egy ilyen ellipszoid középpontja -ben van, tengelyei pedig , , irányúak és hosszuk -, -, ill. -mal arányos. Itt -k () a mátrix sajátvektorai, -k () pedig a sajátértékei. A koncentráció ellipszoidokat úgy képzelhetjük el, mint a Föld (vagy egy csonthéjas gyümölcs) héjszerkezetét: középen a legsűrűbb az anyag, kifelé folyamatosan ritkul. A normális eloszlás ennek megfelelően a középponttól távolodva az ellipszoidok által diktálta ütemben esik egyre kisebb és kisebb valószínűséggel.

Az egyszerűség kedvéért legyen , pedig diagonális mátrix elemekkel a főátlóban. A 4.12 ábrán egy koncentráció ellipszoidját látjuk a függőleges koordináta síkok mentén felvágva. A metszeten kialakuló ellipszisek az egyre kisebb koncentráció ellipszoidok síkmetszetei.

4.12. ábra - Koncentráció ellipszoidok

Koncentráció ellipszoidok

4.4.4. A többdimenziós normális eloszlás tulajdonságai

4.6. Tétel. Legyen többdimenziós normális eloszlású. Ekkor koordinátái akkor és csak akkor függetlenek, ha korrelálatlanok.

Általában a függetlenségből következik a páronkénti függetlenség, abból pedig a korrelálatlanság. Hangsúlyozzuk azonban, hogy fordítva általában nem igaz. A fenti állítás szerint viszont az együttesen normális eloszlású esetben a függetlenség, a páronkénti függetlenség és a korrelálatlanság ekvivalens tulajdonságok.

4.7. Tétel. Legyen . Bontsuk fel -at két részvektorra: , . Ekkor és akkor és csak akkor függetlenek, ha korrelálatlanok.

Normális eloszlású valószínűségi vektorváltozó lineáris függvénye is normális eloszlású.

4.8. Tétel. Ha és , ahol típusú mátrix, -dimenziós vektor, akkor

Gyakorlatok

  1. Legyen nem elfajult -dimenziós normális eloszlású. A sűrűségfüggvényeket felhasználva lássuk be, hogy koordinátái akkor és csak akkor függetlenek, ha korrelálatlanok! Szintén a sűrűségfüggvényeket felhasználva, bizonyítsunk hasonló állítást koordinátái helyett részvektoraira!

  2. Legyenek és külön-külön többdimenziós normális eloszlásúak és függetlenek. Lássuk be, hogy az egyesített

    vektor is normális eloszlású!

  3. Legyen együttes sűrűségfüggvénye:

    Mutassuk meg, hogy és külön-külön normális eloszlásúak, de együttesen nem azok!

  4. Legyen együttesen normális eloszlású, azonos szórással. Bizonyítsuk be, hogy és függetlenek és normális eloszlásúak!

4.5. A normális eloszlásból származó eloszlások

4.5.1. A gamma-függvény

4.9. Definíció. A

, függvényt gamma-függvénynek (-függvénynek) nevezzük.

4.10. Tétel. 1. .

2. Speciálisan, , .

3. .

Bizonyítás. 2. Parciálisan integrálva:

3. A standard normális sűrűségfüggvény integrálja a pozitív féltengelyen :

Átrendezve és az helyettesítést végrehajtva:

4.5.2. A khi-négyzet eloszlás

Az valószínűségi változót szabadsági fokú khi-négyzet eloszlásúnak (-eloszlásúnak vagy -eloszlásúnak) nevezzük, ha sűrűségfüggvénye:

A khi-négyzet eloszlást szokták Pearson-féle eloszlásnak, ill. Helmert-féle eloszlásnak is nevezni.

A khi-négyzet eloszlás sűrűségfüggvénye a 4.13 ábrán látható.

4.13. ábra - A khi-négyzet eloszlás sűrűségfüggvénye

A khi-négyzet eloszlás sűrűségfüggvénye

A khi-négyzet eloszlás származtatása a normális eloszlásból.

Legyenek független standard normális eloszlásúak. Ekkor szabadsági fokú khi-négyzet eloszlású.

A khi-négyzet eloszlás kiemelkedő jelentőségét a matematikai statisztika számára éppen a normális eloszlásból való származtatása adja. A khi-négyzet eloszlás a statisztikában normális eloszlású mintaelemek esetén (pl. a széles körben alkalmazott szórásanalízisben) lépten-nyomon használatos. De a nem normális eloszlású mintaelemek esetén is alapvető, pl. a khi-négyzet próbák, ill. a likelihood-hányados próbák esetén ez a határeloszlás.

Ismeretes, hogy esetén , , így a -eloszlás várható értéke és szórásnégyzete:

A khi-négyzet eloszlás tulajdonságai.

4.11. Tétel. ( addíciós tétel.) Legyenek és független -eloszlású valószínűségi változók , ill. szabadsági fokkal. Ekkor szabadsági fokú -eloszlású.

A tétel szavakban kifejezve: független -ek összege , a szabadsági fokok pedig összeadódnak.

Bizonyítás. Legyenek független standard normális eloszlásúak. -et -ként, -et pedig -ként reprezentálva,

adódik, ez pedig szabadsági fokú khi-négyzet eloszlású.

A khi-négyzet eloszlás aszimptotikusan normális, azaz az alábbi érvényes.

4.12. Tétel. Legyen eloszlása . Ekkor standardizáltja eloszlásban tart a standard normális eloszláshoz:

eloszlásban, midőn .

Bizonyítás. Állítsuk elő -et független standard normálisok négyzetösszegeként: . Mivel , , így a standardizált:

De itt az összeadandók függetlenek és azonos eloszlásúak, ezért a központi határeloszlás-tétel miatt a fenti kifejezés eloszlásban -hez konvergál.

A fenti tételből következik, hogy nagy esetén a -eloszlás az eloszláshoz van közel. A és sűrűségfüggvénye a 4.14 ábrán látható.

4.14. ábra - \chi_{30}^{2} és \mathcal{N}(30,60) sűrűségfüggvényeés \chi_{30}^{2} és \mathcal{N}(30,60) sűrűségfüggvénye sűrűségfüggvénye

\chi_{30}^{2} és \mathcal{N}(30,60) sűrűségfüggvénye

A nem-centrált khi-négyzet eloszlás.

Legyenek független normális eloszlású valószínűségi változók: , . Ekkor a

valószínűségi változót szabadsági fokú, nem-centralitási paraméterű nem-centrált khi-négyzet eloszlásúnak nevezzük. Jelölése .

4.15. ábra - \chi_{20}^{2} és \chi_{20}(5) sűrűségfüggvényeés \chi_{20}^{2} és \chi_{20}(5) sűrűségfüggvénye sűrűségfüggvénye

\chi_{20}^{2} és \chi_{20}(5) sűrűségfüggvénye

A nem-centrált khi-négyzet eloszlás abban a speciális esetben, amikor a kiinduló valószínűségi változók 0 várható értékűek, éppen a korábban megismert (centrált) khi-négyzet eloszlás. Azaz .

A és sűrűségfüggvénye a 4.15. ábrán látható.

A következő állítás azt mutatja, hogy nem kell a -k várható értékeit külön-külön ismerni, az eloszlás csak a nem-centralitási paramétertől függ.

4.13. Tétel. Legyenek független normális eloszlású valószínűségi változók:

ahol . Ekkor

eloszlása megegyezik a 4.3 képletben adott eloszlásával, bármilyenek is a feltételt kielégítő számok.

4.5.3. A Student-eloszlás

4.14. Definíció. Az valószínűségi változót szabadsági fokú Student-eloszlásúnak (-eloszlásúnak vagy -eloszlásúnak) nevezzük, ha sűrűségfüggvénye:

Azonnal látható, hogy fenti sűrűségfüggvény a 0-ra szimmetrikus. A Student-eloszlás sűrűségfüggvénye a 4.16 (a) ábrán látható.

szabadsági fok esetén a Student-eloszlás a ( paraméterű) Cauchy-eloszlás.

Megjegyezzük, hogy W. S. Gosset írta „Student” név alatt a cikkeit.

4.16. ábra - A Student-eloszlás sűrűségfüggvénye

A Student-eloszlás sűrűségfüggvénye

A Student-eloszlás származtatása a normális eloszlásból.

4.15. Tétel. Ha , , és független, akkor

-eloszlású szabadsági fokkal.

A Student-eloszlás jelentőségét a matematikai statisztika számára éppen a normális eloszlásból való származtatása adja. A Student-eloszlás a statisztikában normális eloszlású mintaelemek esetén (pl. a -próba, ill. -próba a szórásanalízisben) használatos.

4.16. Tétel. Ha , akkor az szabadsági fokú -eloszlás -hez konvergál.

A és az sűrűségfüggvénye a 4.16 (b) ábrán látható. Megjegyezzük, hogy nagyobb szabadsági fok esetén és az sűrűségfüggvénye annyira egymásra simul, hogy együtt való ábrázolásuk nehézkes.

A Student-eloszlás momentumai.

Legyen -eloszlású. Ha , akkor a -adik momentuma nem létezik (ill. végtelen). A páratlan rendű momentumok (amennyiben léteznek) 0-val egyenlőek.

ha és

ha .

4.5.4. Az F-eloszlás

A valószínűségi változót szabadsági fokú -eloszlásúnak nevezzük, ha sűrűségfüggvénye:

Jelölése: .

4.17. ábra - Az Az F -eloszlás sűrűségfüggvénye-eloszlás sűrűségfüggvénye

Az F -eloszlás sűrűségfüggvénye

Az -eloszlást szokták Fisher-féle eloszlásnak, vagy Snedecor-féle eloszlásnak is nevezni.

és sűrűségfüggvénye a 4.16. ábra (a) részén, -é és -é pedig a (b) részén látható.

Az F-eloszlás származtatása a normális eloszlásból.

Az -eloszlás jelentőségét a matematikai statisztika számára éppen a normális eloszlásból való származtatása adja.

4.17. Tétel. Ha , , továbbá és független, akkor

-eloszlású és szabadsági fokkal.

Az F-eloszlás momentumai.

A várható érték ( esetén véges):

A szórásnégyzet ( esetén véges):

Gyakorlatok

  1. A 4.12 Tétel alapján lássuk be, hogy nagy esetén a -eloszlás az eloszláshoz van közel!

  2. Számítsuk ki várható értékét és szórásnégyzetét!

  3. Igazoljuk, hogy a -eloszlás aszimptotikusan standard normális, az alábbi módon. A

    előállításban független standard normálisak. De majdnem biztosan, ha .

  4. Fogalmazzuk meg és bizonyítsuk be a addíciós tételt a nem-centrált khi-négyzet eloszlásra!

  5. Igazoljuk, hogy ha -eloszlású, akkor -eloszlású!

  6. Lássuk be, hogy ha -eloszlású, akkor -eloszlású!

Ellenőrző kérdések

  1. Hogyan származtatható a -, - és -eloszlás a normálisból?

  2. Mi a -eloszlás várható értéke és szórása?

  3. Mi a - és a -eloszlás határeloszlása, ha ?

5. fejezet - A statisztika alapfogalmai

5.1. A minta

5.1.1. A minta és a minta realizáció

A matematikai statisztika szemléletmódja szerint a megfigyelendő mennyiség valószínűségi változó. Jelöljük ezt a valószínűségi változót -szel. Figyeljük meg -et -szer, egymástól függetlenül. Jelölje a megfigyelési eredményeket. Ezeket a megfigyelési eredményeket nevezzük mintának. Azonban -et sem egy szám -esnek tekintjük, hanem olyan objektumnak, amely magába sűríti a megfigyelések eredményeként adódó összes lehetséges szám -est. Így az mennyiségeket is valószínűségi változóknak tekintjük.

Az független, azonos eloszlású valószínűségi változókat mintának nevezzük. Rögzített esetén az szám -est minta realizációnak nevezzük. (Itt a háttérben lévő eseményteret jelöli.)

5.1. Megjegyzés. 1. A gyakorlatban mindig minta realizációkat figyelünk meg. Ezek azonban megfigyeléssorozatonként különböznek egymástól. A minta elméleti fogalma az összes lehetséges realizációt magába foglalja.

2. Ha egy valószínűségi változó, akkor -re vett minta alatt az -szel azonos eloszlású, független valószínűségi változókat értjük.

3. Ha egy eloszlásfüggvény, akkor eloszlásfüggvényű populációból vett minta alatt független, eloszlásfüggvényű valószínűségi változókat értünk.

4. A statisztika bizonyos fejezeteiben a fentinél tágabban értelmezik a minta fogalmát. Például a többdimenziós statisztikai analízisben az valószínűségi változók többdimenziósak, míg az idősorok analízisében a függetlenség (illetve az azonos eloszlás) feltétele nem teljesül.

5.1.2. A statisztikai mező

A valószínűségszámítás tárgyalása során feltételezik, hogy a háttérben egy valószínűségi mező áll, az valószínűségi változó -n értelmezett, eloszlásfüggvénye , és ismert. A statisztikában ezzel szemben az eloszlásfüggvény nem ismert (illetve az bizonyos paraméterei nem ismertek). A statisztikában megfigyeléseket éppen azért végzünk, hogy az eloszlásfüggvényt megismerjük.

Legyen egy nem üres halmaz, minden -ra legyen valószínűségi mező. Az , összességet statisztikai mezőnek nevezzük. -t paramétertérnek, elemeit pedig paraméternek nevezzük.

Az minta az -n értelmezett, a mintaelemek együttes eloszlásfüggvénye pedig . Itt egyetlen mintaelem eloszlásfüggvénye, a minta együttes eloszlásfüggvénye pedig a függetlenség miatt szorzat alakú. Az eloszásfüggvény éppen akkor lép fel, amikor a statisztikai mezőn a valószínűség az aktuális. A gyakorlatban a statisztikai mező a háttérben marad, ténylegesen az eloszlásfüggvénnyel dolgozunk. Célunk az ismeretlen paraméter felderítése.

5.1.3. Az empirikus eloszlásfüggvény

Próbáljuk meg rekonstruálni a minta alapján az eloszlásfüggvényt!

Legyen rögzített, jelölje

az minta realizáció elemeinek nagyság szerint növekvő permutációját. Az valószínűségi változókat rendezett mintának nevezzük.

az szám -es egy permutációja. Viszont különböző -kra más és más permutáció adja az elemek növekvő sorrendjét. Tulajdonképpen -et mint függvényeket (azaz mint függvényeit) kell sorba rendezni, hogy a rendezett mintához jussunk, tehát a szükséges átrendezés is függ -tól.

Legyen rendezett minta. A következő leképezést empirikus eloszlásfüggvénynek nevezzük:

Az 5.1. ábrán egy 5 elemű minta empirikus eloszlásfüggvénye látható. Az empirikus eloszlásfüggvény olyan lépcsős függvény, amely minden egyes mintaelem helyén -et ugrik. Természetesen, ha több mintaelem egybeesik, akkor alkalmas többszörösét ugorja.

5.1. ábra - 5 elemű minta empirikus eloszlásfüggvénye

5 elemű minta empirikus eloszlásfüggvénye

Valójában az függvény a véletlentől is függ, hiszen a mintaelemek valószínűségi változók.

A továbbiakban legyen minta egy eloszlásfüggvényű populációból. Jelölje az empirikus eloszlásfüggvényt.

5.2. Tétel. Rögzített esetén az alábbiak teljesülnek:

a) binomiális eloszlású;

b) várható értéke ;

c) szórása 0-hoz tart, ha ;

d) sztochasztikusan, ha .

Bizonyítás. a) Nyilván az esemény éppen akkor teljesül, ha pontosan darab mintaelem kisebb -nél. Lévén az , események függetlenek és valószínűségűek, a binomiális eloszláshoz jutunk:

minden -re.

b) Mivel az rendű, paraméterű binomiális eloszlás várható értéke , szórásnégyzete , így

és

c) az előző képletből adódik.

d) Tetszőleges esetén, a Csebisev-egyenlőtlenség alapján

ha .

Az előző állítás szerint az empirikus eloszlásfüggvény az elméleti eloszlásfüggvény jó közelítése, hisz egyrészt az körül ingadozik, másrészt a minta elemszámának növelésével sztochasztikusan -hez konvergál. A nagy számok erős törvényét alkalmazva, a sztochasztikus konvergenciánál erősebb, majdnem biztos konvergenciát is igazolhatunk.

5.3. Tétel. Bármely rögzített esetén

Bizonyítás. Az valószínűségi változók egymástól függetlenek, azonos Bernoulli-eloszlásúak. (Itt a indikátorfüggvényét jelöli az helyen.)

és

minden esetén. Másrészt

Ez utóbbi mennyiség a nagy számok erős törvénye értelmében az összeadandók közös várható értékéhez, azaz -hez konvergál majdnem biztosan. A tétel második állítása hasonlóan bizonyítható.

Az előző állítás tovább finomítható: az is igaz, hogy az egész számegyenesen egyenletesen tart -hez (majdnem biztosan). Azaz az általunk megfigyelt minta alapján képzett függvény segítségével rekonstruálhatjuk az általunk nem ismert eloszlásfüggvényt. Ez adja az alábbi, Glivenkotól és Cantellitől származó tétel jelentőségét.

5.4. Tétel. (A matematikai statisztika alaptétele)

teljesül 1 valószínűséggel.

Az előző állításból és monotonitása alapján igazolható a tétel.

5.1. Példa. Ábrázoljuk közös koordinátarendszerben a standard normális eloszlás elméleti eloszlásfüggvényét és a standard normális eloszlásból vett 50 elemű mintából meghatározott empirikus eloszlásfüggvényt. A mintát generált véletlen számok jelentették a 5.2. ábra elkészítésében.

5.2. ábra - 50 elemű minta empirikus eloszlásfüggvénye és az elméleti eloszlásfüggvény

50 elemű minta empirikus eloszlásfüggvénye és az elméleti eloszlásfüggvény

5.1.4. Hisztogramok

Tekintsünk egy mintát. Beosztjuk a számegyenest osztópontokkal. Tegyük fel, hogy minden mintaelem beleesik az intervallumba. Jelölje az intervallumba eső mintaelemek számát,

Rajzoljunk az intervallum fölé a -vel arányos területű téglalapot, . Így megkapjuk a hisztogramot.

Ha a téglalapok összterülete , akkor a gyakorisági hisztogramhoz jutunk. Pontosabban a gyakorisági hisztogram az az valós függvény, melyre

Ha a téglalapok összterülete 1, akkor a sűrűséghisztogramot kapjuk. Ekkor az -edik téglalap magassága .

5.5. Megjegyzés. 1. A hisztogram alapján következtethetünk az eloszlásra. Az eloszlás (feltételezett) jellegének figyelembe vételével érdemes a hisztogramot megszerkeszteni. A későbbi kiértékelés során figyelembe kell venni, hogy az osztópontokat a mintától függetlenül vettük-e fel. Az osztópontok sűrítésével, vagy ritkításával érhetjük el, hogy a hisztogram ne legyen se túl durva, se ne ,,ugráljon”.

2. Ha a minta feltételezhetően abszolút folytonos eloszlásból származik, akkor a sűrűséghisztogramból következtethetünk a sűrűségfüggvény alakjára.

3. Ha az eloszlás diszkrét, akkor a hisztogram helyett a relatív gyakoriságokat ábrázoló oszlopdiagramot rajzolhatjuk fel.

5.2. Példa. Generáljunk 1500 standard normális eloszlású véletlen számot. Ábrázoljuk a sűrűséghisztogramot ekvidisztáns osztópontok esetén. Próbálkozzunk különböző sűrűségű osztópontokkal. A 5.3. ábra 4 részintervallum esetét mutatja, ez a hisztogram túlságosan durva. A 5.4. ábra 13 részintervalluma megfelelőnek tűnik. A sűrűséghisztogram mellé az elméleti sűrűségfüggvényt is felrajzoltuk. Az 5.5. ábra túl sűrű beosztást mutat.

5.3. ábra - Durva beosztású hisztogram

Durva beosztású hisztogram

5.4. ábra - Megfelelő beosztású hisztogram és az elméleti sűrűségfüggvény

Megfelelő beosztású hisztogram és az elméleti sűrűségfüggvény

5.5. ábra - Túl sűrű beosztású hisztogram

Túl sűrű beosztású hisztogram

5.3. Példa. Generáljunk 200 elemű mintát az rendű paraméterű binomiális eloszlásból. Ábrázoljuk közös koordinátarendszerben a relatív gyakoriságokat és az elméleti valószínűségeket. A 5.6. ábrán * jelöli az elméleti valószínűségek és a relatív gyakoriságok értékét.

5.6. ábra - Valószínűségek és relatív gyakoriságok a binomiális eloszlás esetén

Valószínűségek és relatív gyakoriságok a binomiális eloszlás esetén


Gyakorlatok

  1. Legyen egy empirikus eloszlásfüggvény, egy folytonos elméleti eloszlásfüggvény. Adjunk algoritmust a

    mennyiség kiszámolására.

  2. Legyen és két empirikus eloszlásfüggvény. Adjunk algoritmust a

    mennyiség kiszámolására.

  3. Generáljunk 100 elemű mintát paraméterű exponenciális eloszlásból. Ábrázoljuk az empirikus eloszlásfüggvényt, valamint a sűrűséghisztogramot.

  4. Generáljunk 100 elemű mintát a -en egyenletes eloszlásból. Ábrázoljuk közös koordinátarendszerben az empirikus eloszlásfüggvényt, valamint az elméleti eloszlásfüggvényt. Cseréljük ki az ábrán az egyenletes elméleti eloszlásfüggvényt az eloszlásfüggvényére.

  5. Generáljunk 200 elemű mintát paraméterű binomiális eloszlásból.

    1. Ábrázoljuk közös koordinátarendszerben a relatív gyakoriságokat és az elméleti valószínűségeket.

    2. Ábrázoljuk közös koordinátarendszerben a sűrűséghisztogramot és az elméleti sűrűségfüggvényét.

Ellenőrző kérdések

  1. Mi a minta?

  2. Mi az empirikus eloszlásfüggvény?

  3. Mit állít a statisztika alaptétele?

  4. Mi a sűrűséghisztogram?

5.2. Statisztikák

5.2.1. Az empirikus közép

Legyen minta -re. Az

valószínűségi változót empirikus középnek (más szóval minta átlagnak) nevezzük.

Tegyük fel, hogy -nek létezik véges várható értéke: . Amennyiben nem ismert, úgy a minta alapján meghatározható segítségével következtethetünk -re. várható értéke és szórásnégyzete:

ahol az elméleti szórásnégyzet.

5.2.2. Az empirikus szórásnégyzet

Az

mennyiséget empirikus szórásnégyzetnek nevezzük. Az empirikus szórásnégyzet alapján következtethetünk ismeretlen (elméleti) szórásnégyzetére. Ki fog derülni, hogy erre a célra alkalmasabb alábbi módosítását használni. Az

mennyiséget korrigált empirikus szórásnégyzetnek nevezzük. numerikus kiszámolására és elméleti vizsgálatára is alkalmas az alábbi ún. Steiner-formula.

5.6. Tétel. Tetszőleges esetén

Bizonyítás. A következő átalakításokat végezzük:

várható értékét a Steiner-formulába -et írva számolhatjuk ki:

Tehát a korrigált empirikus szórásnégyzet várható értéke éppen az elméleti szórásnégyzet.

5.2.3. A statisztika fogalma

Legyen minta -re.

5.7. Definíció. Legyen Borel-mérhető függvény. Ekkor a valószínűségi vektorváltozót statisztikának nevezzük.

A fenti definícióban rögzített pozitív egész szám, értéke leggyakrabban 1. Az empirikus közép az egyik legegyszerűbb statisztika, ekkor a függvény:

Természetesen és is statisztikák. Az empirikus eloszlásfüggvény is statisztikának tekinthető: rögzített mellett a fenti értelemben, ha pedig függvénynek tekintjük, akkor kissé általánosabban, helyett a lépcsős függvények halmazát véve képterének.

Az empirikus közép és az empirikus szórásnégyzet az empirikus momentumok speciális esetei. A -adik empirikus momentum:

A -adik empirikus centrált momentum

5.2.4. Az empirikus korrelációs együttható

Tegyük fel, hogy az és az valószínűségi változókat egyszerre meg tudjuk figyelni. Legyen

megfigyelés az kétdimenziós valószínűségi vektorváltozóra (azaz a fenti valószínűségi vektorváltozók független, -vel azonos eloszlásúak). Az

mennyiséget empirikus kovarianciának, a

mennyiséget pedig empirikus korrelációs együtthatónak nevezzük.

Az empirikus közép és az empirikus szórásnégyzet eloszlását tekintjük normális eloszlásból vett minta esetén. Legyen minta az eloszlásból. Ekkor eloszlása . Valóban, független, normális eloszlású valószínűségi változók összege normális eloszlású, míg

5.8. Tétel. Normális eloszlásból vett minta esetén és függetlenek. Ha eloszlása , akkor eloszlása és eloszlása

5.9. Következmény. Normális eloszlásból vett minta esetén

eloszlású. Ez abból adódik, hogy standard normális, pedig eloszlású, és egymástól függetlenek.

Gyakorlatok

  1. Legyen 37.2, 36.8, 37.9, 36.1, 36.7, 37.1, 36.7 egy minta. Számítsuk ki az empirikus közepet és az empirikus szórásnégyzetet.

  2. Az empirikus kovariancia kiszámításához lássuk be, hogy

  3. Írjunk programot az empirikus közép, az empirikus szórásnégyzet és az empirikus kovariancia kiszámítására.

Ellenőrző kérdések

  1. Mi az empirikus közép és empirikus szórásnégyzet?

  2. Mi lesz az empirikus közép és a korrigált empirikus szórásnégyzet eloszlása normális eloszlásból származó minta esetén?

  3. Mi a Steiner-formula?

5.3. Statisztikai adatok áttekintése

5.3.1. Az adatok elemzésének lépései

Általánosan a statisztika feladatai közé tartozik a kísérletek megtervezése, az adatok vételének (a méréseknek, adatgyűjtésnek) a megszervezése, az adatok tárolásának és számítógépes feldolgozásának megoldása. Jelenleg csak arra az esetre koncentrálunk, amikor már megvannak, és számítógépen (vagy írásban) tároltak az adatok.

Az adatok előzetes áttekintésekor figyelembe kell venni, hogy

  • milyen formában tároltak az adatok;

  • mekkora az adathalmaz;

  • homogének-e az adatok;

  • vannak-e hiányzó adatok;

  • az adatok számértékűek vagy általánosabb értékűek;

  • hány dimenziósak az adatok;

  • az adatok egészek, vagy törtek;

  • az adatok csoportosítottak-e.

Ezek után kerülhet sor a minta numerikus és grafikus jellemzőinek meghatározására.

5.3.2. A minta numerikus jellemzői

Ha a mintaelemek az valós számok, akkor az alábbi numerikus jellemzőket kell kiszámítani:

  • a középérték jellemzésére: empirikus közép, medián, módusz;

  • a szóródás jellemzésére: empirikus szórásnégyzet, szórás, minta terjedelem, minimum, maximum;

  • az eloszlás jellemzésére: empirikus kvantilisek, ferdeség, lapultság.

5.3.3. A minta középértékének és szóródásának leírása

A minta középértékét az empirikus középen kívül jellemezhetjük a módusszal és a mediánnal is. Az empirikus módusz az a mintaelem, amely leggyakrabban fordul elő. (Ha több ilyen érték van, akkor pl. a legkisebbet tekintik ezek közül.) Az empirikus medián egy (rendezett) minta esetén , ha páratlan, és ha páros. (Azaz a medián a középső mintaelem, vagy a két középső mintaelem átlaga.)

Az alábbi 11 elemű rendezett mintát tekintjük:

Ennek mediánja a 6. rendezett mintaelem: , módusza a leggyakoribb elem , míg az empirikus közép .

A minta szóródását az empirikus szóráson kívül jellemezhetjük a legkisebb és legnagyobb mintaelem különbségével. Ez a minta terjedelme (range): .

5.3.4. A minta eloszlásának leírása

A minta elhelyezkedését jellemezhetjük a kvantilisek segítségével. A -os empirikus kvantilis az a legkisebb mintaelem, amelynél a mintaelemek -a kisebb vagy egyenlő. A -os (ill. -os) kvantilist alsó (ill. felső) kvartilisnek nevezzük.

Az előző példában az alsó kvartilis , a felső kvartilis .

5.4. Példa. Generáljunk 100 elemű mintát a standard normális eloszlásból. Ábrázoljuk az empirikus eloszlásfüggvényt és a 20%-os, 40%-os, 60%-os és 80%-os kvantiliseket. A megoldás az 5.7. ábrán látható.

5.7. ábra - A 20, 40, 60 és 80 százalékos kvantilisek

A 20, 40, 60 és 80 százalékos kvantilisek


5.3.5. A minta grafikus jellemzői

A legismertebb grafikus elemzési módok:

  • empirikus eloszlásfüggvény;

  • hisztogram;

  • kördiagram;

  • oszlopdiagram;

  • decimális (stem-and-leaf) grafikon;

  • boxdiagram;

A két- és többdimenziós adatok grafikus elemzésére is ismertek eljárások.

A minta alapján javasolt az empirikus eloszlásfüggvény és a sűrűséghisztogram felrajzolása. Érdemes velük azonos koordinátarendszerben ábrázolni a szóbajöhető elméleti eloszlás, ill. sűrűségfüggvényt az illeszkedés jóságának megállapítására. Két minta homogenitásának (azaz azonos eloszlásból származásának) vizsgálatára érdemes a két empirikus eloszlásfüggvényt (ill. a két sűrűséghisztogramot) közös koordinátarendszerben ábrázolni.

5.3.6. Diagramok

A gyakoriságok szemléltetésére szolgál a kördiagram és az oszlopdiagram. Az oszlopdiagram alakja hasonló a hisztogram alakjához, azonban lényeges különbség, hogy oszlopdiagramon nem számértékű jellemzőkre vonatkozó adatok is ábrázolhatóak.

5.5. Példa. Egy városban megszámolták, hogy milyen színű autóból mennyi van. Az arányok százalékban kifejezve: fehér 30%, fekete 5%, kék 25%, piros 20%, zöld 3%, sárga 17%. A kördiagram az 5.8. ábrán, az oszlopdiagram pedig az 5.9. ábrán látható.

5.8. ábra - A gyakoriságok kördiagramja

A gyakoriságok kördiagramja

5.9. ábra - A gyakoriságok oszlopdiagramja

A gyakoriságok oszlopdiagramja


5.3.7. Boxdiagram

A boxdiagram eloszlások elhelyezkedésének és szórásának tömör jellemzésére szolgál. A box (doboz) az alsó és felső kvartilis által határolt. Jelölje az alsó és felső kvartilis távolságát. A felső kvartilistől fölfelé mért 1.5 és 3 távolság közötti mintaelemeket kiugró értékeknek (outlier) nevezzük, míg a 3 távolság fölöttieket extrém értékeknek. Hasonlóan, az alsó kvartilistól lefelé elhelyezkedő mintaelemek közül kijelölhetők a kiugró és az extrém értékek. Az 5.10. ábra bal oldalán egy standard normális eloszlásból generált 100 elemű minta boxdiagramja látható, míg az ábra jobb oldalán eloszlásból generált 100 elemű mintáé.

5.10. ábra - Boxdiagram

Boxdiagram

A boxdiagram jól használható különböző csoportok egyazon jellemző alapján való összehasonlítására.

5.6. Példa. Az 5.11. ábra azt mutatja, hogy a standard normális eloszlás esetén -0.68 és +0.68 az elméleti alsó és felső kvartilis. Elméleti extrém értékek a 4.76-nál nagyobb abszolút értékűek, ezek előfordulása gyakorlatilag esélytelen. Elméleti kiugró értékek 2.72 és 4.76 közé esnek abszolút értékben, ezek előfordulási esélye is csupán 0.66%.

5.11. ábra - Standard normális eloszlás esetén a kiugró és az extrém értékek valószínűsége

Standard normális eloszlás esetén a kiugró és az extrém értékek valószínűsége


Gyakorlatok

  1. Generáljunk 200 elemű mintát a standard normális eloszlásból, számoljuk ki az empirikus mediánt, kvartiliseket, empirikus közepet, szórást és ezek értékét hasonlítsuk össze a megfelelő elméleti értékekkel.

  2. Egy statisztikai programcsomag segítségével végezzük el a tárgyalt grafikus elemzéseket.

Ellenőrző kérdések

  1. Mi a medián és mi a kvartilis?

  2. Mi a boxdiagram?

6. fejezet - Statisztikai eljárások

6.1. Statisztikai becslések

6.1. Definíció. A statisztikát a paraméter torzítatlan becslésének nevezzük, ha .

A torzítatlanság azt jelenti, hogy a becslés a becsülendő paraméter körül ingadozik.

6.2. Definíció. A sorozatot a paraméter konzisztens (erősen konzisztens) becslésének nevezzük, ha sztochasztikusan (majdnem biztosan).

6.1. Példa. Legyen minta. Tegyük fel, hogy véges. Ekkor az -nek torzítatlan és konzisztens becslése. Valóban, nyilvánvaló.

majdnem biztosan teljesül a nagy számok erős törvénye miatt.

Ha és , akkor a torzítatlan és (erősen) konzisztens becslése. Valóban, -et már korábban láttuk. Továbbá, a Steiner-formulát használva

a nagy számok törvénye miatt.

Szavakban a fenti képletek az alábbit jelentik. Az empirikus közép az ismeretlen várható érték torzítatlan és konzisztens becslése. A korrigált empirikus szórásnégyzet pedig az ismeretlen elméleti szórásnégyzet torzítatlan és konzisztens becslése.

6.1.1. A maximum-likelihood-becslés

A maximum-likelihood elv szerint az ismeretlen paraméter azon értékét fogadjuk el, amely mellett a bekövetkezett eredmény maximális valószínűségű.

6.3. Definíció. Legyen minta egy diszkrét eloszlásból, pedig a minta realizáció. Legyen az ismeretlen paraméter. Az

függvényt likelihood-függvénynek nevezzük. Az

függvényt pedig loglikelihood-függvénynek hívjuk.

A maximum-likelihood elv szerint -et kellene maximalizálni szerint. A maximum hely azonban pontosan egybeesik maximumhelyével, hiszen a természetes alapú logaritmus függvény szigorúan monoton növekvő. Így elegendő az maximumhelyét meghatározni.

6.2. Példa. Határozzuk meg a Poisson-eloszlás paraméterének maximum-likelihood becslését! Legyen minta paraméterű Poisson-eloszlásból:

A likelihood-függvény

a loglikelihood-függvény

A maximumhelyet deriválással határozzuk meg:

Innen

a maximum-likelihood becslés. (Ez természetes, hiszen itt éppen várható értéke.)

Az abszolút folytonos esetben a likelihood-függvény a mintaelemek együttes sűrűségfüggvénye.

6.3. Példa. Legyen minta exponenciális eloszlásból. Határozzuk meg maximum-likelihood becslését. Ekkor a sűrűségfüggvény

A likelihood-függvény

A loglikelihood-függvény

A maximum meghatározásához deriválunk:

Innen

a maximum-likelihood becslés. (Ez torzítatlan, hiszen itt a várható érték.)

Most a normális eloszlás paramétereinek becslésére térünk át.

6.4. Példa. Legyen minta az és paraméterű normális eloszlásból. A sűrűségfüggvények

így a loglikelihood-függvény

A megoldandó likelihood egyenletrendszer az alábbi

amelynek egyetlen megoldása és . Mivel

így a másodrendű parciális deriváltakból képzett mátrix az helyen

amely negatív definit, ezért maximum-likelihood becslése az paramétervektornak.

6.1.2. Konfidencia intervallumok

Legyen ismeretlen paraméter, és két statisztika. Azt mondjuk, hogy a intervallum megbízhatósági szintű konfidencia intervallum -ra, ha

Itt szokásos értékei 0.1, 0.05, 0.01.

6.5. Példa. Szerkesszünk szintű konfidencia intervallumot a normális eloszlás várható értékére, ha a szórás ismert.

Legyen minta eloszlásból. Ekkor

Tehát megadható olyan , hogy

A fenti egyenlőtlenséget átrendezve kapjuk, hogy

Tehát

szintű konfidencia intervallum -re. Speciálisan esetén . Így a 90%-os konfidencia intervallum

Gyakorlatok

  1. Lássuk be, hogy a -nek konzisztens, de torzított becslése.

  2. Adjunk maximum-likelihood becslést a Pareto-eloszlás két paraméterére. A Pareto-eloszlás sűrűségfüggvénye ( és a paraméterek.)

  3. Adjunk konfidencia intervallumot a -eloszlás segítségével a normális eloszlás várható értékére, ha a szórás nem ismert.

  4. Legyen minta eloszlásból. Tegyük fel, hogy . Adjunk 95%-os konfidencia intervallumot -re.

Ellenőrző kérdések

  1. Mit nevezünk torzítatlan, illetve konzisztens becslésnek?

  2. Mi a maximum-likelihood-becslés?

  3. Mi a konfidencia intervallum?

6.2. Paraméteres próbák

6.2.1. -próba.

A statisztikai hipotézisek vizsgálatára próbákat (teszteket) alkalmazunk. A legegyszerűbb próba az -próba.

Legyen minta eloszlásból. Tegyük fel, hogy ismert. Az várható értékre az előírás . Tehát a

nullhipotézist kell vizsgálnunk a

altenatív hipotézissel (ellenhipotézissel) szemben. fennállása esetén az

statisztika standard normális eloszlású. Tehát ha igaz, akkor nagy valószínűséggel beleesik egy intervallumba. Ha ez nem áll fenn, akkor az teljesülésére utal.

Tehát a döntési eljárás a következő. Adott értékhez meghatározzuk azt az értéket, melyre

az elsőfajú hiba nagysága. Ha , akkor -at szinten (azaz szignifikancia szinten) elvetjük. Az értékét 0.1, 0.05, 0.01-nek szoktuk választani.

6.6. Példa. Egy gépen 10 mm átmérőjű tengelyeket kell esztergálni. Mintavétel alapján döntsük el, hogy igaz-e.

Vegyünk egy mintát: . Realisztikus feltételezni, hogy a minta normális eloszlásból származik ismert szórással. Legyen . A mintából kiszámoltuk, hogy . Döntsünk 90%-os szinten és között.

A próbastatisztika:

A standard normális eloszlás táblázatából

Azaz . Mivel most , így -at 90%-os szinten elfogadjuk.

Az meghatározását a standard normális sűrűségfüggvény segítségével az alábbiakban szemléltetjük (6.1. ábra).

6.1. ábra - A standard normális sűrűségfüggvény és A standard normális sűrűségfüggvény és u_{\alpha/2} kapcsolata kapcsolata

A standard normális sűrűségfüggvény és u_{\alpha/2} kapcsolata


A alternatív hipotézist kétoldali hipotézisnek nevezzük. Az egyoldali hipotézis lehet vagy alakú.

Most ismertetni fogjuk az -próbát egyoldali alternatív hipotézis esetén. Legyen minta eloszlásból és legyen ismert. Vizsgáljuk a

nullhipotézist a

egyoldali ellenhipotézissel szemben. A próbastatisztika most is

Ennek eloszlása akkor és csak akkor standard normális, ha teljesül. igaz voltára az utal, ha túlságosan nagy. Tehát -at elvetjük, ha , ahol kritikus értéket a standard normális eloszlás eloszlásfüggvénye alapján a képletből határozzuk meg. Itt az előre megadott elsőfajú hiba. meghatározását a 6.2. ábra szemlélteti.

6.2. ábra - A kritikus érték és a standard normális sűrűségfüggvény

A kritikus érték és a standard normális sűrűségfüggvény

6.2.2. Elfogadási és kritikus tartomány

Tekintsünk az valószínűségi változóra vonatkozóan egy elemű mintát: . Az általánosság csorbítása nélkül -et tekinthetjük mintatérnek (azaz összes lehetséges értékei halmazának).

6.4. Definíció. Legyen a nullhipotézis, az ellenhipotézis. -at egyszerű nullhipotézisnek mondjuk, ha egyelemű.

A próba konstrukciója során a mintateret két diszjunkt halmazra bontjuk. Jelölje őket és . Ekkor és

Ha a minta realizációja a halmaz eleme, akkor elfogadjuk a nullhipotézist, ha , akkor a alternatív hipotézist fogadjuk el.

6.5. Definíció. A halmazt elfogadási tartománynak, a halmazt kritikus tartománynak nevezzük.

A

relációt teljesítő számot a próba terjedelmének (a kritikus tartomány terjedelmének) nevezzük.

A próba pontos terjedelme

Ha a próba pontos terjedelme , akkor az értéket a próba szintjének nevezzük. (Az százalékban kifejezett értékére szokás a szignifikancia szint elnevezést is használni.)

Egy-egy konkrét statisztikai próba elvégzése előtt először a próba szintjét (a döntés szintjét) kell rögzíteni. Mivel a próba szintje egyféle helyes döntés valószínűsége ( fennállása esetén a minta realizáció az elfogadási tartomány eleme), a gyakorlatban kis értéket választunk: . Például azt jelenti, hogy döntésünk megbízhatósági szintje 0.95.

Döntésünk - akár elfogadjuk, akár elvetjük a nullhipotézist - lehet helyes, vagy hibás. A döntés során kétféle hibát követhetünk el.

6.6. Definíció. Ha igaz, és ennek ellenére elvetjük, akkor azt mondjuk, hogy elsőfajú hibát követtünk el.

Az elsőfajú hiba elkövetésének valószínűsége (egyszerű nullhipotézis esetén): . Tehát a próba szintjével együtt az elsőfajú hiba elkövetésének valószínűségét is rögzítjük.

6.7. Definíció. Ha a hipotézis az igaz, és mégis elfogadjuk -at, akkor másodfajú hibáról beszélünk.

Egyszerű alternatív hipotézis esetén másodfajú hibát

valószínűséggel követhetünk el.

6.2.3. Kétmintás -próba

Ezzel az eljárással két független, ismert szórású, normális eloszlású valószínűségi változó várható értékének azonosságáról dönthetünk.

Legyenek , ill. eloszlású független valószínűségi változók, és ismert paraméterek. -re vonatkozóan tekintsünk egy , -ra vonatkozóan egy elemű, egymástól független mintát: . Legyen a próba szintje . Hipotézisünk:

A próbastatisztika

standard normális eloszlású, ha fennáll. A továbbiakban hasonlóan járunk el, mint az egymintás -próba esetén.

Ha (vagy ) alakú, akkor az egyoldali próbát kell alkalmazni.

6.2.4. Próbák konstrukciója

Tegyük fel, hogy 5 mm átmérőjű csapágygolyókat kell gyártani. A minőségellenőrzés során mely tételeket nyilvánítsanak jónak, és melyeket selejtnek? Tegyük fel az egyszerűség kedvéért, hogy a gyártás során csupán az a hiba léphet fel, hogy a berendezés rossz beállítás miatt túl nagy, vagy túl kicsi golyókat gyárt. Vegyünk mintát, azaz mérjük meg db kiválasztott golyó átmérőjét. Az átmérők átlaga . Ha 5 mm közelében van, akkor jók a golyók, ha túl nagy, vagy túl kicsi, akkor selejtesek. De mik legyenek azok a kritikus értékek, amelyek alatt, ill. fölött már selejtesnek minősítjük a golyókat? Ehhez segít hozzá az statisztika:

eloszlása esetén standard normális. A standard normális eloszlású valószínűségi változó azonban nagy valószínűséggel egy intervallumban veszi fel értékeit. Ha ezen az intervallumon kívül esik értéke, akkor arra gondolhatunk, hogy a kiinduló hipotézisünk nem volt igaz, így -at elvetjük.

A kritikus tartomány megadása azonban nemcsak a nullhipotézistől, hanem a alternatív hipotézistől is függ. Tekintsük most azt az esetet, amikor az élelmiszerbolt vezetője a sütödétől 2 kg-os kenyereket vásárol. a nullhipotézis, pedig az ellenhipotézis, amit a boltvezető tekint, hisz számára csak a túl kicsi kenyér a rossz. Így csak akkor fogja a szállítmányt visszautasítani, ha a megmért kenyerek súlyának átlaga túl kicsi. Egyoldali -próbát alkalmazhat, és a kritikus (elutasítási) tartománya alakú lesz. Tehát a kritikus tartományt úgy kell megválasztani, hogy a számunkra „rossz” esetektől óvjon.

Mikor jó egy próbastatisztika? Az -próba esetén ismeretes, hogy ha a valódi paraméter közel van a nullhipotézisben szereplő paraméterhez, akkor -at kis eséllyel vetjük el, míg ha távol van tőle, akkor nagy eséllyel vetjük el a -at.

A fentiek alapján a próbastatisztika legyen olyan, hogy

  1. eloszlása pontosan ismert esetén,

  2. másképpen viselkedjen, ha nem igaz, mint akkor, amikor igaz,

  3. ha „nagyon nem igaz”, akkor a próbastatisztika viselkedése térjen el nagyon attól, ahogy esetén viselkedik.

Ha a fenti elveknek megfelelő próbastatisztikát már megtaláltuk, akkor annak alapján már tudjuk, merre van a jó és merre a rossz. De pontosan hol húzzuk meg a határt a jó (az elfogadási tartomány) és a rossz (a kritikus tartomány) között? Ez az elsőfajú hiba megválasztásával történik. Ha pl. egy preciziós műszert gyártunk, akkor az alkatrészek közül szigorúan válogatunk: vállaljuk, hogy selejtnek minősítünk egy jó alkatrészt is, semmint véletlenül rosszat építsünk be. Tehát az elsőfajú hibát nagynak választjuk. Azt azonban, hogy a szokásos értékek (0.1, 0.05, 0.01) közül melyiket választjuk, a konkrét probléma alapján döntjük el.

6.2.5. Egymintás -próba

Legyen eloszlású valószínűségi változó, ahol az várható érték és a szórás ismeretlenek. Az valószínűségi változóra vonatkozó elemű minta . A próba szintje . A hipotézis a várható értékre vonatkozik:

Ismert, hogy valószínűségi változó paraméterű (Student)-eloszlású, ahol

és

Tehát ha a nullhipotézis igaz, a

próbastatisztika paraméterű -eloszlású. Az paraméterű -eloszlás táblázatából kiolvasható az a kritikus érték, amelyre

fennáll. Erre az értékre igaz, hogy

A kritikus tartomány tehát:

és az elfogadási tartomány:

Egyoldali esetben az ellenhipotézis

Ekkor azt a értéket kell kikeresnünk a táblázatból, amely a következő összefüggést teljesíti:

Az egyoldali ellenhipotézishez tartozó kritikus tartomány:

Gyakorlatok

  1. Automata csővágó gép 1200 mm-es darabok levágására van beállítva. A levágott cső hossza véletlentől függő változó, előzetes adatfelvételből tudjuk, hogy normális eloszlású és szórása 3 mm. Kiválasztunk 16 levágott csövet. A mintából kapott méretek:

    Elfogadható-e 95% -os szinten, hogy az eltérés nem szignifikáns, vagyis a méretek ingadozása csak a véletlen műve?

  2. Adott két független minta a szórású normális eloszlásból. Az egyik, 9 elemű minta realizációjának átlaga 0.1672; a másik 16 mérésből álló minta realizáció átlaga 0.1683. Elfogadható-e 92% -os szinten, hogy a két sokaság várható értéke megegyezik?

Ellenőrző kérdések

  1. Mi a nullhipotézis, ellenhipotézis, elsőfajú hiba, másodfajú hiba, elfogadási tartomány, kritikus tartomány?

  2. Mi az -próba?

6.3. Khi-négyzet próbák

6.3.1. Tiszta illeszkedésvizsgálat

Legyen egy teljes eseményrendszer. Legyenek adott számok, . Döntsünk a

nullhipotézis érvényességéről.

Hajtsuk végre az eseményrendszert tartalmazó kísérletet -szer, egymástól függetlenül. Jelölje az bekövetkezései számát. Képezzük a

statisztikát. Ha fennáll, akkor aszimptotikus eloszlása .

A statisztika szerkezete:

A statisztika kicsiny volta utal arra, hogy a megfigyelt értékek közel vannak azokhoz, melyeket a fennállása esetén várunk. Tehát ha kicsi, akkor -at elfogadjuk. Ha nagy (azaz meghaladja a kritikus értéket) akkor -at elvetjük. Adott szinthez a kritikus értéket a eloszlás táblázatából határozhatjuk meg. A -próba nagy esetén alkalmazható, mivel a statisztika eloszlása csupán aszimptotikusan .

6.7. Példa. Állapítsuk meg, hogy egy dobókocka szabályos-e. Jelölje azt az eseményt, hogy a kockán -t dobunk (). Ekkor

A kocka 600-szori feldobásakor az alábbi eredmény adódott:

( jelöli gyakoriságát). A -statisztika:

fennállása esetén a statisztika aszimptotikusan eloszlású. -at akkor vetjük el szinten, ha meghaladja az szinthez tartozó kritikus értéket. A kritikus értéket a eloszlás táblázatából keressük ki. esetén ez 9.236, esetén 15.09, míg esetén 20.51. Tehát -at valamennyi használatos szinten elvetjük.

6.3.2. Az illeszkedésvizsgálat végrehajtása

A kiinduló probléma az, hogy a megfigyelt valószínűségi változó eloszlásfüggvénye egyenlő-e az előre megadott eloszlásfüggvénnyel. Fogalmazzuk át a feladatot az előző sémára. Osszuk fel értékkészletét páronként diszjunkt részhalmazokra. Legyen az az esemény, hogy értéke -be esik. Ekkor az a teljes eseményrendszer, amelyre az előző eljárást alkalmazni fogjuk. Jelölje a valószínűséget abban az esetben, ha az valódi eloszlásfüggvénye. Az így megadott értékek szerepelnek a próbastatisztikában.

Figyeljük meg -et -szer egymástól függetlenül, jelölje az gyakoriságát. Az így adódó számokkal készítsük el a

statisztikát. Ha meghaladja az szinthez tartozó kritikus értéket, akkor szinten elvetjük azt a hipotézist, hogy eloszlásfüggvénye .

6.8. Megjegyzés. Mivel a statisztikánk esetén vett határeloszlása , így az eljárás nagy -ekre alkalmazható. A kézikönyvek azt ajánlják, hogy a minta elemszáma olyan nagy legyen, hogy minden gyakoriság legalább 6-nál (más művek szerint 10-nél) nagyobb legyen. Viszont a mintaelemszám általában rögzített. Ilyenkor osztályokat vonunk össze: egyesítjük azokat az eseményeket, melyekre a gyakoriságok kicsik. Az összevonás utáni teljes eseményrendszerre végrehajtjuk a -próbát.

6.8. Példa. Vizsgálandó, hogy az valószínűségi változó eloszlása megegyezik-e a paraméterű Poisson-eloszlással. A Poisson-eloszlás táblázata alapján az , és eseményekből álló teljes eseményrendszert érdemes alapul venni, mivel

elemű mintát véve -re, az események gyakoriságára rendre adódott. Ekkor

szinten a táblázatából 7.779 kritikus érték adódik. Így -at szinten elfogadjuk.

Most azt vizsgáljuk, hogyan dönthető el a normalitás.

6.9. Példa. eloszlása standard normális.

Jelölje a standard normális eloszlásfüggvényt. A táblázat alapján

A

osztópontokat választjuk. A fennállása esetén az egyes intervallumok valószínűségei:

Az -re végzett megfigyelés alapján az egyes intervallumokba esések gyakoriságaira az alábbiak adódtak:

A statisztika:

-at minden használatos szinten elvetjük, hisz a táblázat alapján a 0.95 szinthez 16.92, a 0.99 szinthez 21.67, sőt még az 0.995 szinthez is csupán 23.59 kritikus érték tartozik. A statisztikánk aktuális értéke még ezen legutóbbit is meghaladja.

6.3.3. Becsléses illeszkedésvizsgálat

A gyakorlatban az eloszlásfüggvény alakjára van feltételezésünk, azonban az eloszlásfüggvény bizonyos paraméterei nem ismertek. Legyen

ahol az eloszlásfüggvényében a (egydimenziós) paraméterek ismeretlenek. A minta alapján becsüljük meg az ismeretlen paramétereket maximum-likelihood módszerrel. Jelölje a maximum-likelihood becslését. Vizsgáljuk a

hipotézist a korábban ismertetett eljárással. A módszerben a változás csupán annyi, hogy a -eloszlás szabadsági fokát a becsült paraméterek számával kell csökkenteni, azaz a kritikus értéket táblázatából kell kikeresni.

6.3.4. Függetlenségvizsgálat

Legyen és két teljes eseményrendszer. A két teljes eseményrendszer függetlenségét vizsgáljuk:

Amennyiben a két teljes eseményrendszerhez tartozó valószínűségek ismertek, akkor tiszta illeszkedésvizsgálatra vezethető vissza a feladat:

ahol előre megadott számok. Mivel itt

egy teljes eseményrendszer és

egy adott valószínűségeloszlás, az előző rész alapján a próbastatisztika megkonstruálható. A határeloszlás esetén lesz.

Azonban sokkal realisztikusabb az a felfogás, hogy a és számok nem ismertek, így azokat a mintából kell becsülni. Hajtsuk végre a két teljes eseményrendszert tartalmazó kísérletet -szer, függetlenül. Jelölje az esemény gyakoriságát. A gyakoriságokat foglaljuk ún. kontingencia táblázatba.

 

 

 

     

 

 

A peremeken található számok:

Az események ismeretlen valószínűségét a relatív gyakorisággal becsüljük:

Így megfigyelt értéke , várt értéke ( esetén)

lesz. Így a -statisztika:

Az ismeretlen paraméterek: ; azonban a és miatt csupán darab -t és darab -t kell becsülni. Így (azaz a függetlenség) fennállása esetén a -statisztika aszimptotikusan

eloszlású.

6.10. Példa. Független-e a hajszín és a szemszín? 200 embert megfigyelve az alábbiak adódtak:

A szabadsági fok . Mivel a táblázata alapján még az -hez tartozó kritikus érték is csupán 13.82, így -at minden használatos szinten elvetjük.

Ellenőrző kérdések

  1. Mi az illeszkedésvizsgálatra vonatkozó -próba?

  2. Mi a függetlenségvizsgálatra szolgáló -próba?

6.4. Szórásanalízis, regresszióanalízis

6.4.1. Szórásanalízis

A szórásanalízis (ANOVA=ANalysis Of VAriance) alapkérdése: több minta esetén a várható értékek egyenlőek-e. Alapvető feltétel: minták egymástól is függetlenek, normális eloszlásból származnak, és a szórásaik egyenlőek! Tehát a minták között csak a várható értékeikben lehet eltérés.

Egyszeres osztályozás.

A legegyszerűbb szórásanalízisbeli modell az egyszeres osztályozás (one-way classification, one-way layout). Itt egyetlen tényező szintjeit kell összehasonlítani. Mivel a megfigyelések eredményeit tényezőnként egy-egy oszlopban szokták elhelyezni, a tényezők szintjeinek hatását oszlophatásnak nevezzük. Példaként tekintsünk egy mezőgazdasági kísérletet.

6.11. Példa. Három különböző műtrágya hatását mérték 9, 6, ill. 8 kísérleti alanyon. Itt az egyetlen tényező a műtrágya, annak 3 szintje van. A műtrágya hatására a terméseredményeket a fenti táblázat mutatja. Vizsgáljuk meg azt a nullhipotézist, hogy a terméseredmények várható értékei egyenlőek!

A megfigyelések: az -edik szinten végzett -edik megfigyelés. Az egyes szinteken nem feltétlen kell azonos számú mérést végezni.

Feltesszük, hogy

Elérhető, hogy legyen. Vezessük be az jelölést.

Vizsgáljuk a

nullhipotézis teljesülését! azt jelenti, hogy az egyes szinteknek nincs hatása.

A Steiner-formula alapján az db négyzetösszege előáll

alakban, ahol

a teljes átlag. A fenti felbontásban szereplő első négyzetösszeg jelölése , elnevezése teljes négyzetösszeg. előáll

alakban, ahol az -edik szint átlaga.

méri a szintek közötti szóródást, pedig a szinteken belüli szóródást (azaz a véletlen hibát). -at akkor vetjük el, ha túlságosan nagy -höz képest.

6.9. Tétel. és függetlenek. Továbbá . akkor és csak akkor -eloszlású, ha a

nullhipotézis teljesül.

A próbastatisztikáról szól a következő tétel.

6.10. Tétel. Az

statisztika pontosan akkor és szabadsági fokú -eloszlású, ha a

nullhipotézis teljesül.

Bizonyítás. Az előző tétel szerint esetén két független, a szabadsági fokával elosztott, -eloszlású valószínűségi változó hányadosa. Ezért az -eloszlás definíciója alapján ennek eloszlása ( esetén) -eloszlás és szabadsági fokokkal.

Az eddigiek alapján az alábbi szórásfelbontó táblázatot adhatjuk meg az egytényezős osztályozásra.

-at szinten elvetjük, ha a kapott -statisztika értéke nagyobb, mint , azaz a megfelelő szabadsági fokú -eloszlás táblázatából kikeresett (felső) kritikus érték.

6.12. Példa. (A 6.11. példa folytatása.) A (számítógépes) eredményt a szórásfelbontó tábla tartalmazza:

Az elnevezések magyarázata. Source = a szóródás forrása; Columns = oszlophatás (szintek közötti eltérések); Error = véletlen hiba; Total = teljes négyzetösszeg; df (degree of freedom) = szabadsági fok; SS (Sum of Squares) = négyzetösszeg; MS (Mean Square) = tapasztalati szórásnégyzet (négyzet átlag), F = F-statisztika. Annak kérdéséről, hogy a műtrágya három szintjének van-e hatása, az alatti mennyiség alapján döntünk. Amennyiben : a tényező szintjeinek nincs hatása nullhipotézis teljesül, az alatti statisztika -eloszlású (jelenleg szabadsági fokkal). Ez alapján határozható meg a próba pontos terjedelme: . Példánkban p=0.00021 érték adódott, azaz minden használatos szinten elvetjük a műtrágyák egyforma hatását. A hagyományos (táblázatos) kiértékelés ugyanerre a következtetésre vezet. értékét összehasonlítva a szabadsági fokú -eloszlás kritikus értékével, azt kapjuk, hogy a nullhipotézist 95%-os szinten el kell vetni. Ez azt jelenti, hogy a műtrágya tényező különböző szintjeinek van hatásuk a terméseredményre. Megjegyezzük, hogy az eljárást formálisan végrehajtottuk, azonban az alapfeltevések nem teljesülnek. Példánkban sem a szórások nem egyenlőek, sem a normalitás nem igaz (ez utóbbi grafikus eljárások, azaz hisztogram és Gauss-papír alapján adódott). Transzformációkkal (logaritmus, illetve törtkitevős hatvány vétele) részleges javulást sikerült elérni, a transzformáció elvégzését az olvasóra bízzuk.

Egy újabb példát tekintünk, melyhez számítógépes megoldás is tartozik.

6.13. Példa. Három különböző takarmány hatását mérték 11, 10, ill. 9 kísérleti állaton. Itt az egyetlen tényező a takarmány, annak 3 szintje van. A takarmány hatására a súlynövekedések:

Az eredmény a szórásfelbontó tábla:

Annak kérdéséről, hogy a takarmány három szintjének van-e hatása, az alatti mennyiség alapján döntünk. Amennyiben : “a tényező szintjeinek nincs hatása” nullhipotézis teljesül, az alatti statisztika -eloszlású (jelenleg 2, 27 szabadsági fokkal). Ez alapján határozható meg a próba pontos terjedelme: . A fenti program értéket adott, azaz minden használatos szinten elvetjük a takarmányok egyforma hatását.

6.4.2. Regresszióanalízis

A regresszióanalízis feladata az X és az Y változók közötti függvénykapcsolat felderítése.

Egyváltozós lineáris regresszió.

Legyenek és nem független valószínűségi változók. Az értékét (amelyet nehezebb mérni) közelíteni fogjuk az egyszerűbben mérhető egy lineáris függvényével:

Feladatunk az és állandók meghatározása. A közelítés esetén a ,,hibát” az tényleges értéke és a lineáris közelítésének a különbsége, azaz az

különbség adja. Az és paraméterek értékét úgy határozzuk meg, hogy arra az

várható érték minimális legyen (legkisebb négyzetek elve).

Amennyiben és folytonos valószínűségi változók és ismert a együttes sűrűségfüggvényük, akkor az előbbi várható értéket az

alakban felírva adhatjuk meg. Így feladatunk azon és értékek meghatározása, amelyre az előbbi kettős integrál értéke minimális lesz.

Az

jelöléseket használva

adódik. Így az valószínűségi változónak -re vonatkozó (elméleti) regressziós egyenesének egyenlete:

Az és mennyiségeket az valószínűségi változó -re vonatkozó lineáris regressziója együtthatóinak nevezzük.

Legyen és legyen . Ekkor -nak -re vonatkozó regressziós egyenesében szereplő együtthatók értéke:

Így -nak -re vonatkozó regressziós egyenese:

A regressziós egyenes együtthatóinak becslése.

Az és együttes eloszlásfüggvényét (s így folytonos esetben az együttes sűrűségfüggvényét) általában nem ismerjük. Emiatt a regressziós egyenes egyenletét nem tudjuk az előbbieknek megfelelő módon meghatározni. Rendelkezésünkre áll viszont az párra egy , -elemű minta, amelynek segítségével - a legkisebb négyzetek módszerét használva - becsülni tudjuk a regressziós együtthatókat.

Legyen az -nak -re vonatkozó (elméleti) regressziós egyenesének egyenlete

Ha helyébe az mintaelemeket írjuk be, akkor a hibákat az

mennyiségek adják. A legkisebb négyzetek módszerét használva úgy kell meghatározni az és regressziós együtthatókat, hogy a

négyzetösszeg minimális legyen. Az

jelöléseket bevezetve

adódik, ahol és az és regressziós együtthatók legkisebb négyzetes becslése. Így a tapasztalati regressziós egyenes egyenlete:

vagy standardizált alakban:

A lineáris modell.

a lineáris modell, ahol

-dimenziós megfigyelés vektor,

méretű, nem véletlen, megfigyelt mátrix (a magyarázó változók mátrixa),

-dimenziós ismeretlen paraméter,

nem megfigyelhető -dimenziós véletlen vektor (hiba).

Általában , ezt szükség esetén fel fogjuk tenni. A gyakorlatban a magyarázó változók száma, pedig a megfigyelt objektumok száma, tehát ésszerű feltétel.

A legkisebb négyzetek módszere.

Ha és ( ismeretlen paraméter), akkor homoszkedasztikus esetről beszélünk. Ekkor a legkisebb négyzetes becslést (OLS=Ordinary Least Squares) alkalmazzuk -ra: ez lesz .

Legyen tehát az -et minimalizáló vektor. (Itt a norma -ben.)

6.11. Tétel. legkisebb négyzetes becslés az

normálegyenlet megoldása.

Bizonyítás. mikor a legkisebb? Ha éppen az ortogonális komp­lementere az altérre vonatkozóan. Itt az oszlopai által generált altér. Azaz merőleges minden oszlopára, tehát

vagyis .

6.12. Megjegyzés. invertálható .

Ha , akkor

Ez éppen a normálegyenlettel ekvivalens, ha invertálható.

6.13. Tétel. Legyen és . Ekkor torzítatlan becslése -nak, továbbá .

Ha , akkor .

Bizonyítás. Ha , akkor invertálható. Ekkor , hiszen . Másrészt

ugyanis .

Ha , akkor , így - lévén lineáris függvénye - maga is normális eloszlású.

A Gauss-Markov-tétel.

A homoszkedasztikus esetben legkisebb négyzetes becslés a legjobb lineáris torzítatlan becslés (BLUE=Best Linear Unbiased Estimator). Ezt mondja ki a Gauss-Markov-tétel.

6.14. Tétel. (Gauss-Markov.) Ha és , akkor a paraméter vektor legjobb lineáris torzítatlan becslése.

6.14. Példa. Legyen diák magassága és súlya. Keressünk összefüggést a két adat között!

Jelölje az oszlopvektort, az mátrix első oszlopa legyen 1-esekből álló, a második pedig az legyen. Ekkor éppen a súlynak a magasság lineáris függvényével való közelítését adja. Ha azonban úgy gondoljuk, hogy a súly a magasság másodfokú függvénye, akkor az előző mátrixot egészítsük ki az vektorral. Ez az alakú közelítést írja le.

Könnyen látható, hogy az általános lineáris modellel tetszőleges fokszámú polinomiális közelítés is leírható.

Ellenőrző kérdések

  1. Mi a szórásfelbontó táblázat?

  2. Mi az egyváltozós lineáris regresszió?

7. fejezet - Appendix

7.1. Kombinatorika

Faktoriális. .

Szemifaktoriális. .

Binomiális együttható. .

Permutáció. különböző elem összes lehetséges sorrendjének a száma: .

Ismétléses permutáció. elem összes lehetséges sorrendjének a száma, ha egyező van közöttük: .

Variáció. különböző elemből darab lehetséges kiválasztásainak a száma, ha nincs visszatevés és a sorrend számít: .

Ismétléses variáció. különböző elemből darab lehetséges kiválasztásainak a száma, ha van visszatevés és a sorrend számít: .

Kombináció. különböző elemből darab lehetséges kiválasztásainak a száma, ha nincs visszatevés és a sorrend nem számít: .

Ismétléses kombináció. különböző elemből darab lehetséges kiválasztásainak a száma, ha van visszatevés és a sorrend nem számít: .

A binomiális tétel.

A Pascal-háromszög képzési szabálya. .

7.2. Sorozatok, sorok, határértékek

Ha , akkor .

.

Ha , akkor .

Mértani sorozat. Ha , akkor

Mértani sor. Ha , akkor

Harmonikus sor. A sor konvergál, ha , és divergál, ha .

Hatványsor. A hatványsor konvergenciasugara , ahol

Azaz a sor konvergál, ha , és divergál, ha .

Az szám. .

A Stirling-formula. , azaz

7.3. Differenciálszámítás

A Taylor-formula.

ahol az és az között fekvő valamely pont.

Az függvényre a Taylor-formula.

Az Taylor-sora.

Az függvényre a Taylor-formula.

ahol .

A L'Hospital-szabály.

vagy

esetén

Kétváltozós függvény szélső értékei. Ha az függvénynek az pontban szélső értéke van (és léteznek a parciális deriváltjai) akkor

Legyen továbbá

(és legyenek első és második parciális deriváltjai az egy környezetében folytonosak). Teljesüljön 7.1. Ekkor

a) esetén az függvénynek az pontban szélső értéke van, mégpedig

(i) szigorú maximuma, ha ,

(ii) szigorú minimuma, ha ;

b) esetén az függvénynek az pontban nincs szélső értéke;

c) esetén pedig előfordulhat, hogy az pontban van szélső érték, de az is, hogy nincs szélső érték.

Az a) rész (i) esetére példa az lefelé néző paraboloid, melynek az pontban maximuma van; az (ii) esetre példa az felfelé néző paraboloid, melynek az pontban minimuma van; míg a b) részre példa az nyeregfelület, melynek az pontban nincsen sem maximuma, sem minimuma (7.1. ábra).

7.1. ábra - Paraboloidok és nyeregfelület

Paraboloidok és nyeregfelület

7.4. Integrálszámítás

Ebben a szakaszban Riemann-integrálról lesz szó.

Integrálás helyettesítéssel. Az integrálba az helyettesítés:

ahol és .

Parciális integrálás.

Helyettesítés kettős integrál esetén. Az integrálba az helyettesítés:

ahol a kétdimenziós tartomány a kétdimenziós tartomány képe az folytonosan differenciálható, kölcsönösen egyértelmű leképezés által,

a leképezés Jacobi-determinánsa.

7.5. Vektorok és mátrixok

Transzponálás. Az -dimenziós euklideszi tér vektorait oszlopvektoroknak tekintjük, a segı́tségével jelölt transzponáltjaik tehát sorvektorok:

Belső szorzat és diadikus szorzat. Legyen és két -beli vektor. Az skalár a két vektor belső szorzata, mı́g az méretű mátrix a két vektornak a diadikus szorzata:

Merőleges (ortogonális) vetítés. Legyen az -dimenziós euklideszi tér egy vektora, pedig egy altere. Ekkor egyértelműen létezik egy , melyre merőleges a -re (azaz merőleges minden elemére). az merőleges vetülete -re, pedig a merőleges (ortogonális) komplementere (7.2. ábra).

7.2. ábra - Az Az \boldsymbol{y} vektor merőleges vetülete a V altérre vektor merőleges vetülete a Az \boldsymbol{y} vektor merőleges vetülete a V altérre altérre

Az \boldsymbol{y} vektor merőleges vetülete a V altérre

van -hoz a legközelebb a altérből:

Ez a legkisebb négyzetek elvének az alapja.

Sajátérték, sajátvektor. Legyen -es mátrix, . Ha teljesül, és , akkor -t az sajátvektorának, -t pedig sajátértékének nevezzük.

Szimmetrikus mátrixok spektrálfelbontása. Az valós elemű szimmetrikus mátrix sajátértékei valósak, a különböző sajátértékekhez tartozó sajátvektorok ortogonálisak. Van a térnek az sajátvektoraiból álló ortonormált bázisa. Ennek alapján az spektrálfelbontása:

ahol a ortogonális mátrix oszlopai az ortonormált sajátvektorai, a diagonális mátrix főátlójában pedig az sajátértékei állnak.

Szimmetrikus, pozitív szemidefinit mátrix négyzetgyöke. Legyen az szimmetrikus, pozitív szemidefinit mátrix spektrálfelbontása 7.2. Itt a -k nemnegatívak. Legyen , ahol

A szimmetrikus, pozitív szemidefinit mátrix az négyzetgyöke: .

7.6. Megoldások

7.6.1. 1. fejezet

1.1. szakasz

Szövegközi feladatok

1.1. Útmutatás. (1) Az igazolandó összefüggések képletei:

(2) A de Morgan-féle azonosságok tetszőlegesen sok eseményre:

A feladatok megoldásához jó támogatást kapunk, ha az eseményeket Venn-diagrammal szemléltetjük, a valószínűségüket a területükként fogjuk fel, miközben az egész területét 1-nek választjuk.

1.3. Útmutatás. Alkalmazzuk rendre az , és diszjunkt felbontásokat.

Szakasz-végi feladatok

1. Megoldás:

4. c) Útmutatás. Alkalmazzuk az 1.5 formulát többször.

5. Megoldás. a) , b) (!).

6. Megoldás.

7. Megoldás. .

8. Megoldás. (!)

9. Megoldás. .

10. Megoldás. .

11. Megoldás. .

12. Megoldás. .

1.2. szakasz.

Szakasz-végi feladatok

2. Útmutatás. Vizsgáljuk két szomszédos tag nagyságviszonyát! Kiderül, hogy a valószínűségek növekvőek, amíg eléri -t (egészrész).

Megoldás. A maximális tag a -edik, ha nem egész, ill. két maximális tag van, ha egész: a -adik és a -edik.

4. Megoldás.

5. Útmutatás. Szemléltessünk Venn-diagrammal. a) halmazsorozat csökkenő, és

b) Csökkenő halmazsorozat tagjainak komplementeréből álló sorozat növekvő.

1.3. szakasz

Szakasz-végi feladatok

1. Megoldás. .

4. Megoldás. Az eredeti választás esetén 1/3, ha megváltoztatja a választását, úgy 2/3 eséllyel nyeri a csokit.

5. Megoldás. a) ; b) .

6. Útmutatás. Alkalmazzuk a 2. gyakorlat eredményét! Megoldás: .

8. Megoldás. .

9. Útmutatás. Jelölje az első tartályban lévő golyók számát az 1., a 2., ill. a 3. lépés után. Nyilván

A teljes valószínűség tétele alapján:

10. Megoldás. a) ; b) .

1.4. szakasz

Szövegközi feladatok

1.5. b) Megoldás. Ha független minden eseménytől, akkor önmagától is független, így . Megfordítva, ha , akkor . Ha , akkor , így - az a) feladat alapján - független minden eseménytől.

1.6. a) Legyen , míg és két nem független esemény.

b) Első megoldás. Dobjunk fel egy érmét kétszer egymás után. Legyen .

Második megoldás. Három szabályos érme feldobásakor legyen

Ekkor

Szakasz-végi feladatok

3. Megoldás. nyerését jelentő játszmasorozatok:

4. Útmutatás. Alkalmazzuk a Borel-Cantelli-lemmát.

6. Megoldás. .

7. Megoldás. a) 90%, b) 10%

9. Megoldás.

10. Megoldás. , ha .

7.6.2. 2. fejezet

2.1. szakasz

Szövegközi feladat

2.3. Útmutatás. Összegezzünk a részrendszerben nem szereplő indexekre a 2.4 feltételben.

Szakasz-végi feladatok

2. Megoldás. Legyen és , ha

4. Megoldás.

5. Megoldás.

6. Megoldás. Legyen Ekkor a

egyenleteket összegezve -re,

adódik. Innen a definícióval . Ebből

jelöléssel a geometriai eloszlás szokásos képlete adódik. Nyilván esetén az 1 pontba koncentrált eloszlást, míg esetén a -be koncentrált nem valódi eloszlást kapjuk.

7. Megoldás. A jó termékekre

a selejt szériákra

2.2. szakasz

Szakasz-végi feladatok

1. Útmutatás. A lottó játék, illetve a biztosítás adhat ötletet.

2. Megoldás.

4. Útmutatás. Az

összeg minden tagja nemnegatív, az összeg azonban mégis 0.

8 Megoldás.

2.3. szakasz

Szakasz-végi feladatok

1. Útmutatás. A számolás analóg a Poisson-eloszláséval.

2. Megoldás.

3. Megoldás.

A

összefüggést használva választással

4. Megoldás.

6. Megoldás.

2.4. szakasz

1. Megoldás.

5. Útmutatás. Legyen

illetve

Fejtsük ki a jobb oldalát!

6. Útmutatás. Lásd a 2.14. példát.

2.5. szakasz

Szakasz-végi feladatok

1. Útmutatás. Számítsuk ki a azonosság mindkét oldalán együtthatóját!

2. Megoldás. , .

3. Útmutatás. vizsgálatával éppen az eloszlás növekvő, ill. csökkenő szakasza különíthető el.

4. Megoldás. ; .

6. Megoldás. 1/27.

13. Útmutatás. Feltételezhetjük, hogy a hibák száma egy cm-es darabban Poisson-eloszlású. A paraméter . Annak valószínűsége, hogy egy cm-es szálban nincs hiba: . Viszont darab cm-es szálban átlagosan hibátlan van (a binomiális eloszlás várható értéke).

7.6.3. 3. fejezet

3.1. szakasz

Szövegközi feladat

3.4. b) Útmutatás. Legyen egy szakaszon.

c) Útmutatás. Legyen olyan, hogy és valamely -ra.

Szakasz-végi feladatok

1. Útmutatás. Ellenőrizzük, hogy teljesülnek-e az eloszlásfüggvények jellemző tulajdonságai.

3. Megoldás. Legyen , ha , és , ha ; másrészt legyen , ha , és , ha . Ekkor és eloszlása megegyezik.

4. Útmutatás. Nyilván . Továbbá, -re

7. Megoldás.

ha .

8. Megoldás. , ha .

10. Megoldás. , meredeksége az origótól távolodva csökken. Így a keresett intervallum alsó végpontja 0, a felső .

3.2. szakasz

Szakasz-végi feladatok

2. Útmutatás: ellenőrizzük, hogy teljesülnek-e a sűrűségfüggvények jellemző tulajdonságai.

4. Megoldás. , ha .

5. Megoldás. , ha .

8. Megoldás. Maximumhely: , inflexiós pont: .

9. Útmutatás. Ha , akkor standard normális eloszlású. Így elegendő meghatározni -t . Viszont a standard normális eloszlás szimmetriája miatt, ahol a standard normális eloszlásfüggvény. táblázatából a keresett három valószínűség rendre 0.6826; 0.9544; 0.9972.

10. Útmutatás. A görbe ,,magasabb” része alatti terület nagyobb.

3.3. szakasz

Szakasz-végi feladatok

1. Megoldás.

2. Megoldás.

4. Megoldás. , .

5. Megoldás. , és .

3.4. szakasz

Szakasz-végi feladatok

1. Útmutatás. Az eloszlásfüggvény

ahol az indikátor függvény, . Felrajzolva a fenti kettős integrál által reprezentált területet, adódik.

2. Megoldás.

ha ;

ha ; , ha ; és szimmetrikus (azaz páros függvény).

6. Útmutatás. Induljunk ki az

összefüggésből, és vegyük figyelembe a marginális sűrűségfüggvény alakját!

7. Megoldás. Nem függetlenek.

3.5. szakasz

Szövegközi feladat

3.12. Útmutatás. Ha koordinátái korrelálatlanok, akkor diagonális alakú, így is. Ezért a vele képzett kvadratikus forma négyzetösszeg, tehát szorzattá bomlik:

Könnyen látható, hogy ilyen esetben , konstans szorzótól eltekintve, nem lehet más, mint sűrűségfüggvénye. Tehát -k függetlenek.

Szakasz-végi feladatok

1. Útmutatás.

2. Útmutatás. eloszlásfüggvénye:

Polárkoordinátákra térve:

előállítást kapjuk. (Másik megoldás adódik -ból.)

3. Útmutatás. -re

ahol standard normális, azaz komponensei független (standard) normálisak. Innen azonnal adódik, hogy független normálisak összege, így maga is normális.

3.6. szakasz

Szakasz-végi feladatok

2. Megoldás: .

3. Megoldás: , .

3.7. szakasz

Szövegközi feladat

3.15. Útmutatás.

7.6.4. 4. fejezet

4.1. szakasz

Szakasz-végi feladatok

2. Megoldás.

és -n kívül .

és -n kívül .

4.2. szakasz

Szakasz-végi feladatok

1. Útmutatás. (a) Használjuk a feltételes valószínűség definícióját!

A (b) részben a monoton csökkenő függvényre Cauchy-típusú függvényegyenletet kapunk: . Ennek megoldása alakú.

2. Megoldás.

4.4. szakasz

Szakasz-végi feladatok

2. Útmutatás. Lássuk be, hogy egydimenziós normális.

3. Megoldás. sűrűségfüggvénye:

Így standard normális eloszlású. Hasonlóan is az. Ezért mindkét várható érték 0. A kovariancia:

mert mindkét változóban páros. Ha együttesen normális eloszlású lenne, akkor a korrelálatlanságból következne a függetlenség. Ezért az együttes sűrűségfüggvény

lenne.

Ez egyben korrelálatlan, de nem független abszolút folytonos eloszlásokra is példa.

4.5. szakasz

Szakasz-végi feladatok

1. Útmutatás. Jelölje az standardizáltjának eloszlásfüggvényét, pedig a standard normális eloszlásfüggvényt. A 4.12 Tétel azt jelenti, hogy . Mivel folytonos, így a konvergencia egyenletes: . Ebbe a relációba -et helyettesítve kapjuk, hogy eloszlásfüggvényének és eloszlásfüggvényének a különbsége 0-hoz tart.

2. Útmutatás. Ha , akkor

(ez utóbbit a standard normálisra visszavezetve kaphatjuk). Ezután alkalmazzuk definícióját!

7.6.5. 5. fejezet

5.1. szakasz

Szakasz-végi feladatok

1. Megoldás.

ahol a minta realizáció eloszlásfüggvényű sokaságból.

2. Megoldás.

ahol a minta realizáció eloszlásfüggvényű sokaságból.

4. Útmutatás. Ha -en egyenletes eloszlású, akkor és , így eloszlása „közel van” -höz.

5. Útmutatás. b) Ha binomiális eloszlású és paraméterrel, akkor és a központi határeloszlás tételből eloszlása -hez tart. Azaz aszimptotikusan eloszlású.

5.2. szakasz

Szakasz-végi feladatok

1. Megoldás.

7.6.6. 6. fejezet

6.1. szakasz

Szakasz-végi feladatok

2. Megoldás. A loglikelihood függvény

ha és egyébként. nem differenciálható az helyen, azonban látható, hogy rögzítése után maximumát az helyen veszi fel, így . A

függvény viszont már differenciálható, így megoldva a

likelihood egyenletet a becslést kapjuk.

6.2. szakasz

Szakasz-végi feladatok

1. Megoldás. Jelölje valószínűségi változó a levágott cső hosszát. A hipotézis:

Kétoldali -próbát végzünk. Az adatokból és adódik. A 0.05 terjedelmű kritikus tartomány a következő:

A nullhipotézist tehát 95%-os szinten el kell vetnünk.

2. Megoldás.

. Kétmintás -próbát végezhetünk. A próbastatisztika értékére adódik. . A kritikus tartomány tehát:

A minta alapján a várható értékek egyenlőségét el kell vetni.

7.7. Táblázatok

7.3. ábra - A standard normális eloszlás táblázata

A standard normális eloszlás táblázata

7.4. ábra - A standard normális eloszlás táblázata

A standard normális eloszlás táblázata

7.5. ábra - A khi-négyzet próba táblázata

A khi-négyzet próba táblázata

7.6. ábra - Az Az F -próba táblázata-próba táblázata

Az F -próba táblázata

7.7. ábra - Az Az F -próba táblázata-próba táblázata

Az F -próba táblázata

7.8. ábra - Az Az F -próba táblázata-próba táblázata

Az F -próba táblázata

7.9. ábra - Az Az t -próba táblázata-próba táblázata

Az t -próba táblázata

7.10. ábra - A binomiális eloszlás táblázata

A binomiális eloszlás táblázata

7.11. ábra - A binomiális eloszlás táblázata

A binomiális eloszlás táblázata

7.12. ábra - A binomiális eloszlás táblázata

A binomiális eloszlás táblázata

7.13. ábra - A binomiális eloszlás táblázata

A binomiális eloszlás táblázata

7.14. ábra - A Poisson-eloszlás táblázata

A Poisson-eloszlás táblázata

7.15. ábra - A Poisson-eloszlás táblázata

A Poisson-eloszlás táblázata

7.16. ábra - A Poisson-eloszlás táblázata

A Poisson-eloszlás táblázata

7.17. ábra - A Poisson-eloszlás táblázata

A Poisson-eloszlás táblázata

Irodalomjegyzék

[1] Ash, R. B.. Basic Probability Theory. John Wiley & Sons, New York-London-Sydney-Toronto. 1970.

[2] Ash, R. B.. Real Analysis and Probability. Academic Press, New York-London. 1972.

[3] Bauer, H.. Probability Theory. Walter de Gruyter, Berlin-New York. 1996.

[4] Bognár Jánosné, Mogyoródi József, Prékopa András, Rényi Alfréd, Szász Domokos. Valószínűségszámítás (feladatgyűjtemény). Tankönyvkiadó, Budapest. 1971.

[5] Borovkov, A. A.. Matematikai statisztika. Typotex, Budapest. 1999.

[6] Fazekas István. Valószínűségszámítás. Egyetemi jegyzet, DE, Debrecen. 2009.

[7] Fazekas István (szerkesztő). Bevezetés a matematikai statisztikába. Egyetemi jegyzet, DE, Debrecen. 2009.

[8] Feller, W.. Bevezetés a valószínűségszámításba és alkalmazásaiba. Műszaki Könyvkiadó, Budapest. 1978.

[9] Gihman, I. I., Szkorohod, A. V.. Bevezetés a sztochasztikus folyamatok elméletébe. Műszaki Könyvkiadó, Budapest. 1975.

[10] Giri, N. C.. Introduction to probability and statistics. Marcel Dekker, Inc., New York. 1993.

[11] Halmos, P. R.. Mértékelmélet. Gondolat, Budapest. 1984.

[12] Járai Antal. Mérték és integrálelmélet. Egyetemi jegyzet, KLTE, Debrecen. 1990.

[13] Johnson, N. L., Kotz, S.. Distributions in Statistics. Discrete Distributions. Houghton Miffin, Boston. 1970.

[14] Johnson, N. L., Kotz, S.. Distributions in Statistics. Continuous Univariate Distributions. Houghton Miffin, Boston. 1970.

[15] Kolmogorov, A. N.. A valószínűségszámítás alapfogalmai. Gondolat, Budapest. 1982.

[16] Lukács Ottó. Matematikai statisztika. Műszaki Könyvkiadó, Budapest. 2006.

[17] Móri F. Tamás, Székely J. Gábor. Többváltozós statisztikai analízis. Műszaki Könyvkiadó, Budapest. 1986.

[18] Obádovics J. Gyula. Valószínűségszámítás és matematikai statisztika. Scolar Kiadó, Budapest. 2009.

[19] Prékopa András. Valószínűségelmélet műszaki alkalmazásokkal. Műszaki Könyvkiadó, Budapest. 1972.

[20] Reimann József, Tóth Julianna. Valószínűségszámítás és matematikai statisztika. Nemzeti Könyvkiadó, Budapest. 2008.

[21] Rényi Alfréd. Valószínűségszámítás. Tankönyvkiadó, Budapest. 1954, 1981.

[22] Shiryaev, A. N.. Probability. Springer-Verlag, New York. 1996.

[23] Williams, D. W.. Weighing the odds. A course in probability and statistics. Cambridge University Press, Cambridge. 1996.