Exemplu: Fie Y numărul de fete din exemplul anterior. Este important de reținut că distribuția lui Y este aceeași cu distribuția lui X, dar XY. În acest caz, între X și Y există o relație deterministă. .

Astfel, dacă avem un spațiu de bază dat de un set de fenomene elementare, variabila aleatorie poate fi înțeleasă ca o funcție care atribuie o valoare numerică fiecăruia dintre fenomenele elementare. De exemplu. NV X atribuie valoarea 0 unui fenomen elementar, valoarea 1 unui fenomen elementar etc. Probabilitatea de a observa o anumită valoare a NV X este apoi dată de suma probabilităților fenomenelor elementare pe care dobândește această valoare. De exemplu. .

Este adesea folosit pentru a prescurtarea în cazul NV-urilor discrete. să subliniem că X poate lua anumite valori specifice (în loc de generale).

Distribuția probabilității poate fi dată

  • tabel (tip x/p (x))
  • grafic:
    variabilă aleatorie
  • după formulă:

În exemplu, alegeți mai întâi numărul de copii din familie (). Ne vom limita la. Vom observa o variabilă discretă aleatorie care, similar cu primul exemplu, va reprezenta numărul de băieți dintr-un număr dat de copii dintr-o familie. Presupunem că probabilitatea ca un băiat să se nască este. Se pare că poate lua valori. Aplicația calculează probabilitatea de apariție pentru fiecare valoare. Probabilitatea pentru este calculată conform formulei. Distribuția probabilității cantității este prezentată grafic și, de asemenea, printr-un tabel.

5.2 Caracteristicile NV discrete

La începutul capitolului 2, am avut probe aleatorii (număr de copii, înălțimi), am găsit distribuția abundențelor relative și pe baza acestora am determinat valoarea medie și varianța (eșantionului). Dacă gama de selecție ar fi aproape de infinit, numerele relative s-ar apropia de probabilitățile corespunzătoare. Prin urmare, este logic să se definească valoarea medie și varianța populației resp. distribuții de probabilitate.

Definiția 5.2.1: (Populația) înseamnă NV este .
Variația (populației) a NV X este .
Modul NV X este valoarea pentru care .
Media X NV este valoarea pentru care .
Abaterea medie a NV X este sau .
Abaterea standard este .

Notă: Desemnăm adesea valoarea medie ca sau. De multe ori denotăm și împrăștierea prin sau. Mediana nu trebuie să fie clar determinată de condițiile date.

Teorema 5.2.2: Se aplică la:

Notă: Cantitatea este notată ca și se numește al doilea moment (non-central) (variabila aleatoare X sau distribuția X). Cantitatea este numită și al 2-lea moment central. Teorema 5.2.2 conține așa-numitul formă calculată - pentru a calcula varianța conform acestei formule este mai ușor decât prin definiție.

Exemplu: Calculați media și varianța distribuției numărului de băieți dintr-o familie aleatorie cu 3 copii.

0 1/8 0 -3/2 9/4 32/9 0
1 3/8 3/8 -1/2 1/4 3/32 3/8
2 3/8 6/8 1/2 1/4 3/32 12/8
3 1/8 3/8 3/2 9/4 32/9 9/8
Control: .
Dacă P (băiat) = 1/2, atunci se așteaptă și valoarea medie de 1,5.

În exemplu, alegeți mai întâi numărul de copii () din familie. Ca și în exemplu, vom fi interesați de media și varianța mai mari ale distribuției numărului de băieți. Aplicația calculează pentru fiecare valoare, valorile corespunzătoare), precum și valorile din toate celelalte coloane date în exemplul de mai sus. Apoi, se calculează valoarea pentru mod, mediană, deviația medie și deviația standard. Aplicația funcționează cu fracții pentru a face calculul pentru medie și varianță mai clar. Se calculează, de asemenea, valoarea celui de-al doilea moment non-central.

Dacă transformăm liniar NV X, se aplică echivalentul propoziției 2.3.3:

Declarația 5.2.3: Fie NV să fie media și varianța. Apoi, pentru media și varianța NV se aplică următoarele:
.

5.3 Distribuția binomială

Un exemplu de variabilă aleatoare binomială este .
În general: să avem „experimente” independente (experimentele lui Bernoulli), fiecare dintre care se încheie cu „succes” sau „eșec” cu o probabilitate resp., Unde . Apoi se numește variabilă aleatoare binomială. Faptul că o variabilă aleatorie are o distribuție binomială va fi notat .

De exemplu, dacă fiecare secvență de 5 rezultă cu 2 succese și 3 eșecuri are aceeași probabilitate. Numărul de modalități de a alege un loc pentru 2 reușite din 5 încercări este. Prin urmare, este adevărat. În general, pare să se aplice o formulă analogă

Exemplu: Să fie 60% din populația SUA democrați și restul republicani. 5 alegători au fost selectați aleatoriu. Care este probabilitatea ca

  1. trei dintre ei sunt democrați?
  2. majoritatea sunt democrați?
A)
b) .

Alege procentul din populația care este democrați. Astfel, obținem probabilitatea apariției unui democrat (). Apoi, alegeți numărul de selectoare (). Aplicația calculează valorile pentru, pe care le afișează într-un tabel și grafic. Prin urmare, examinăm o variabilă aleatorie care reprezintă numărul de democrați din numărul de alegători pe care i-am introdus. Conform formulei date mai jos de applet, calculează și media și varianța.

Teorema 5.3.1: Dacă NV, atunci pentru medie și varianță: .

Dovadă: Deoarece pentru, este deoarece ultima sumă este suma tuturor probabilităților unei variabile aleatorii cu o distribuție. Prin analogie, QED se aplică varianței.

5.4 Distribuția geometrică

Și aici vom presupune că efectuăm experimente Bernoulli (adică independente, cu probabilitate de succes). Fie ca o variabilă aleatorie să aibă o distribuție geometrică (adică în acest caz, spre deosebire de o distribuție binomială, o variabilă aleatorie este numărul de încercări făcute). Deoarece toate încercările înainte de primul succes trebuie să fie eșecuri, ordinea succeselor și eșecurilor este clar determinată. Prin urmare:

Propunerea 5.4.1: Dacă NV, atunci pentru medie și varianță: .

Exemplu: Selectăm aleatoriu S.U.A. alegătorii. Ne întrebăm când vom întâlni primul alegător al democraților. Lasă-l să se aplice din nou. Atunci

  • ;
  • ;
  • .
Numărul mediu de anchete despre preferințele electorale pare să fie .

Din nou, selectați procentul din populația () care sunt democrați. Studiem o variabilă aleatorie care reprezintă numărul de încercări înainte de a întâlni primul democrat. Valorile individuale ale probabilităților pentru apariția unui democrat, pentru experimentul nr. De la 1 la 9 sunt prezentate grafic. De asemenea, calculăm media și varianța, în conformitate cu relațiile de mai sus.

5.5 Distribuția binomială negativă

Baza acestei diviziuni este din nou experimentele Bernoulli (adică independente, cu probabilitate de succes). Fie variabila Random să aibă o distribuție binomială negativă. Și aici, numărul de încercări efectuate este redus cu o variabilă aleatorie, redus cu numărul necesar r mult noroc. Deoarece succesul trebuie să fie ultimul, ordinea succeselor și eșecurilor este determinată de pozițiile succeselor anterioare. Prin urmare:

Propunerea 5.5.1: Dacă NV, atunci pentru medie și varianță: .

Acest rezultat este în concordanță cu așteptarea intuitivă pe care valoarea medie a așteptării r-succesul este r-multiplu al așteptării medii pentru un (primul) succes.

Exemplu: Selectăm aleatoriu S.U.A. alegătorii. Ne întrebăm când ne vom întâlni cu al patrulea alegător al democraților. Lasă-l să se aplice din nou. Atunci

  • ;
  • ;
  • ;
  • ;
  • .
Numărul mediu de anchete despre preferințele electorale pare să fie .

5.6 Distribuția Poisson

Distribuția Poisson este distribuția numărului de evenimente aleatorii într-un interval de timp sau loc fix, dacă evenimentele apar cu o frecvență medie fixă ​​și independent de (timp, loc) apariții anterioare. Este indicat numărul mediu de apariții al evenimentului. Această valoare este singurul parametru al distribuției. Se aplică la:

Această distribuție este un caz limitativ al unei distribuții binomiale cu o probabilitate de succes în funcție de numărul de încercări. Dacă este adevărat într-o astfel de diviziune, atunci .

Propunerea 5.6.1: Dacă NV, atunci pentru medie și varianță: .

Exemplu: Supermarketul a promis că va plăti compensații financiare clienților care vor aștepta la checkout mai mult de 10 minute. Numărul mediu de case de marcat care trebuie să funcționeze, astfel încât clienții să nu fie nevoiți să plătească nimic este 5. Care este probabilitatea ca nici măcar 10 case de marcat să nu fie suficiente pentru a deservi toți clienții în decurs de 10 minute?
Dacă acceptăm presupunerea că sosirile clienților sunt independente și omogene în timp, atunci numărul de clienți în intervalul de 10 minute și, astfel, numărul de case de marcat necesare, are o distribuție Poisson. Numărul de case de marcat necesare este împărțit la Po (5). Pentru asta

  • ;
  • ;
  • ;
  • .
  • ;
Prin urmare, probabilitatea ca nici zece casieri să nu fie suficiente este, așadar .

5.7 Distribuția hipergeometrică

Distribuția hipergeometrică este similară cu distribuția binomială pentru populațiile finite. Fie dimensiunea populației de la care individul are un anumit punct final (). Selectăm aleatoriu indivizi din populație (fără vărsături, prin urmare). Numărul de indivizi care au proprietatea observată în această selecție este o variabilă aleatorie cu o distribuție hipergeometrică. Datorită metodei de selecție pentru se aplică

Notă: Limitele rezultă din limitele naturale pentru numerele combinate: și în același timp .

Dacă și, atunci diviziunea converge la .

Propunerea 5.7.1: Dacă NV, atunci pentru medie și varianță: .

Exemplu: Printre grupul de 30 de studenți universitari din Statele Unite, există 18 alegători democrați și 12 alegători republicani. 5 dintre ele au fost selectate aleatoriu. Care este probabilitatea ca

  1. trei dintre ei sunt democrați?
  2. majoritatea sunt democrați?
A)
b) .

5.8 Distribuții continue

Distribuția aleatorie cu o distribuție continuă este destul de bine descrisă printr-un grafic cu bare cu frecvențe relative. Noi stim aia. Prin urmare, prin simpla scalare, putem realiza că aria totală a graficului este egală cu 1. Apoi, aria coloanei din fiecare interval este egală cu abundența relativă a clasei și, astfel, aproximativ egală cu probabilitatea că variabila aleatorie observată capătă o valoare aparținând acestui interval. Prin urmare, definim: Cu toate acestea, graficul său este afectat

  1. întâmplător (am doar o selecție, nu întregul fișier);
  2. prin alegerea numărului și a limitelor claselor.
Putem elimina aceste efecte
  1. creșterea numărului de observații;
  2. prin rafinarea claselor (1 permite 2).
Asa de
Trecând, dacă în același timp lățimea clasei merge la 0, obținem o curbă lină numită densitatea probabilității. Suprafața totală de sub ea este egală cu 1.

Acest applet generează numere din distribuție. Intervalul este împărțit în câte intervale mai mici de aceeași lungime pe care le alegeți. Numerele generate sunt sortate în aceste intervale, iar numerele pentru fiecare interval sunt calculate (adică, câte dintre numerele generate aparțin fiecăruia dintre intervale). Deci, puteți crește/micșora numărul de numere care vor fi generate și, de asemenea, crește/micșora numărul menționat de clase (rafinarea clasei).

Mai ales pentru variabilele aleatoare continue este, i. etc.

Acestea sunt cazurile limitative ale formulelor din secțiunea 2.2. Nici valorile modului și nici valorile mediane nu trebuie determinate fără ambiguități.

Definiția 5.8.3: Funcția de distribuție NV se numește funcție .

Propunerea 5.8.4: Dacă NV este continuu cu densitatea, atunci este valabil pentru funcția sa de distribuție

Astfel, funcția de distribuție determină în mod clar distribuția probabilității.

5.9 Distribuție normală

Multe variabile aleatorii, de ex. erorile apărute în măsurarea mărimilor chimice, fizice sau economice, au o distribuție normală. Din punct de vedere matematic, această distribuție are cele mai frumoase proprietăți, presupunând normalitatea, multe probleme sunt în mod explicit rezolvabile. Multe alte divizii, de ex. binomial, poate fi bine aproximat de normal.

a) distribuție normală normalizată

O variabilă aleatorie are o distribuție normală normală dacă densitatea sa de probabilitate este

Teorema 5.9.1: Permiteți variabilei aleatorii să aibă o distribuție normală normală. Apoi se aplică

Dovadă: Aparent
Folosind pentru petreceri

întrucât funcția între paranteze pătrate este impară și funcția sub integrală este densitatea. QED.

Această distribuție este denumită adesea densitatea și funcția de distribuție. Valorile sunt în tabele (diverse programe își pot calcula și aproximările numerice).

- graficul densității distribuției graficului applet. Puteți muta punctul de întrerupere prin care trebuie calculat conținutul zonei de sub grafic, i. valoarea funcției de distribuție. Graficul funcției de distribuție este, de asemenea, reprezentat grafic și legat de graficul densității. Graficul funcției de distribuție arată punctul al cărui y-Coordonata determină conținutul graficului sub densitatea pe interval. Valoarea exactă este scrisă în câmpul de text.

Notă: Dacă variabila aleatoare X are o medie și o varianță, atunci variabila aleatoare are o medie de 0 și o varianță de 1. Această transformare se numește normalizare sau standardizare a variabilei aleatoare.

Exemplu: Găsi .
În tabele găsim. Din aceasta

  • ;
  • ;
  • .
În ultima linie am folosit simetria densității (în jurul valorii de zero), ceea ce duce la simetria centrală a funcției de distribuție, adică. .

(b) distribuție normală generală

Se naște dintr-o distribuție normală normală prin trecerea la o medie și la scalare - ori astfel încât să aibă o varianță. Are o densitate pe care o numim această diviziune. Densitatea este simetrică în jurul valorii medii. Daca atunci .

5.10 Funcția variabilă aleatorie

Luați în considerare din nou o familie aleatorie cu 3 copii și presupuneți că costul echipamentului sportiv de familie depinde doar de numărul de băieți: unde este numărul de băieți. De exemplu: (în €).

Valoarea medie a costului echipamentului sportiv în familie este Dar nu a trebuit să calculăm distribuția, am putea proveni direct din distribuția unei variabile aleatorii:

01501/8150/8
12403/8720/8
22703/8810/8
32401/8240/8
1920/8

Propunerea 5.10.1: Fie NV să fie o diviziune și să fie o funcție al cărei domeniu conține toate valorile posibile. Atunci când este discret resp. NV continuu.

Notă: Din această afirmație rezultă că simbolul mediu este un operator liniar. Uneori folosim paranteze după aceasta pentru a defini exact din ce facem o valoare medie. De exemplu. Am putea afirma, de asemenea, definiția varianței sub forma resp. . Liniaritatea sa poate fi utilizată în calcule; De exemplu: Această formă echivalentă pentru varianță se numește formă de calcul, deoarece de obicei este mult mai simplu de calculat decât prin definiție.