Aleatoriu bidimensional. Variabilă aleatoare bidimensională

O pereche ordonată (X, Y) de variabile aleatoare X și Y se numește o variabilă aleatoare bidimensională sau un vector aleator în spațiul bidimensional. O variabilă aleatoare bidimensională (X,Y) se mai numește și un sistem de variabile aleatoare X și Y. Mulțimea tuturor valorilor posibile ale unui discret variabilă aleatoare cu probabilitățile lor se numește legea de distribuție a acestei variabile aleatoare. O variabilă aleatoare bidimensională discretă (X, Y) este considerată dată dacă legea sa de distribuție este cunoscută:

P(X=x i , Y=y j) = p ij , i=1,2...,n, j=1,2...,m

Scopul serviciului. Folosind serviciul, conform unei legi de distribuție date, puteți găsi:

  • seriile de distribuție X și Y, așteptarea matematică M[X], M[Y], varianța D[X], D[Y];
  • covarianța cov(x,y), coeficientul de corelație r x,y, seria de distribuție condiționată X, așteptarea condiționată M;
În plus, este dat răspunsul la întrebarea „variabilele aleatoare X și Y sunt dependente?”.

Instrucţiuni. Specificați dimensiunea matricei de distribuție a probabilității (număr de rânduri și coloane) și tipul acesteia. Soluția rezultată este salvată într-un fișier Word.

Exemplul nr. 1. O variabilă aleatoare discretă bidimensională are un tabel de distribuție:

Y/X 1 2 3 4
10 0 0,11 0,12 0,03
20 0 0,13 0,09 0,02
30 0,02 0,11 0,08 0,01
40 0,03 0,11 0,05 q
Aflați valoarea lui q și coeficientul de corelație al acestei variabile aleatoare.

Soluţie. Găsim valoarea lui q din condiția Σp ij = 1
Σp ij = 0,02 + 0,03 + 0,11 + … + 0,03 + 0,02 + 0,01 + q = 1
0,91+q = 1. De unde provine q = 0,09?

Folosind formula ∑P(x i,y j) = p i(j=1..n), găsim seria de distribuție X.

Așteptări M[Y].
M[y] = 1*0,05 + 2*0,46 + 3*0,34 + 4*0,15 = 2,59
Varianta D[Y] = 1 2 *0.05 + 2 2 *0.46 + 3 2 *0.34 + 4 2 *0.15 - 2.59 2 = 0.64
Abaterea standardσ(y) = sqrt(D[Y]) = sqrt(0,64) = 0,801

Covarianta cov(X,Y) = M - M[X] M[Y] = 2 10 0,11 + 3 10 0,12 + 4 10 0,03 + 2 20 0,13 + 3 20 0,09 + 4 ·20·0,02 + 1·30·0,02 + 2·30·0.11 + 3·30·0.08 + 4·30·0.01 + 1·40·0.03 + 2·40·0.11 + 3·40·0.05 + 4·40 ·0.09 - 25.2 · 2.59 = -0.068
Coeficientul de corelare r xy = cov(x,y)/σ(x)&sigma(y) = -0,068/(11,531*0,801) = -0,00736

Exemplul 2. Datele din prelucrarea statistică a informațiilor privind doi indicatori X și Y sunt reflectate în tabelul de corelare. Necesar:

  1. scrieți seriile de distribuție pentru X și Y și calculați mediile eșantionului și abaterile standard ale eșantionului pentru acestea;
  2. scrieți seria de distribuție condiționată Y/x și calculați mediile condiționate Y/x;
  3. descrieți grafic dependența mediilor condiționate Y/x de valorile X;
  4. se calculează coeficientul de corelație al eșantionului Y pe X;
  5. scrieți un eșantion de ecuație de regresie directă;
  6. descrieți geometric datele din tabelul de corelare și construiți o linie de regresie.
Soluţie. O pereche ordonată (X,Y) de variabile aleatoare X și Y se numește o variabilă aleatoare bidimensională sau un vector aleator în spațiul bidimensional. O variabilă aleatoare bidimensională (X,Y) se mai numește și un sistem de variabile aleatoare X și Y.
Setul tuturor valorilor posibile ale unei variabile aleatoare discrete cu probabilitățile lor se numește legea de distribuție a acestei variabile aleatoare.
O variabilă aleatoare bidimensională discretă (X,Y) este considerată dată dacă legea sa de distribuție este cunoscută:
P(X=x i , Y=y j) = p ij , i=1,2...,n, j=1,2..,m
X/Y20 30 40 50 60
11 2 0 0 0 0
16 4 6 0 0 0
21 0 3 6 2 0
26 0 0 45 8 4
31 0 0 4 6 7
36 0 0 0 0 3
Evenimentele (X=x i, Y=y j) formează un grup complet de evenimente, deci suma tuturor probabilităților p ij ( i=1,2...,n, j=1,2..,m) indicat în tabel este egal cu 1.
1. Dependența variabilelor aleatoare X și Y.
Găsiți seriile de distribuție X și Y.
Folosind formula ∑P(x i,y j) = p i(j=1..n), găsim seria de distribuție X. Așteptări M[Y].
M[y] = (20*6 + 30*9 + 40*55 + 50*16 + 60*14)/100 = 42,3
Varianta D[Y].
D[Y] = (20 2 *6 + 30 2 *9 + 40 2 *55 + 50 2 *16 + 60 2 *14)/100 - 42,3 2 = 99,71
Abaterea standard σ(y).

Deoarece P(X=11,Y=20) = 2≠2 6, atunci variabilele aleatoare X și Y dependente.
2. Legea distribuției condiționate X.
Legea distribuției condiționate X(Y=20).
P(X=11/Y=20) = 2/6 = 0,33
P(X=16/Y=20) = 4/6 = 0,67
P(X=21/Y=20) = 0/6 = 0
P(X=26/Y=20) = 0/6 = 0
P(X=31/Y=20) = 0/6 = 0
P(X=36/Y=20) = 0/6 = 0
Așteptări matematice condiționate M = 11*0,33 + 16*0,67 + 21*0 + 26*0 + 31*0 + 36*0 = 14,33
Varianta condiționată D = 11 2 *0,33 + 16 2 *0,67 + 21 2 *0 + 26 2 *0 + 31 2 *0 + 36 2 *0 - 14,33 2 = 5,56
Legea distribuției condiționate X(Y=30).
P(X=11/Y=30) = 0/9 = 0
P(X=16/Y=30) = 6/9 = 0,67
P(X=21/Y=30) = 3/9 = 0,33
P(X=26/Y=30) = 0/9 = 0
P(X=31/Y=30) = 0/9 = 0
P(X=36/Y=30) = 0/9 = 0
Așteptări matematice condiționate M = 11*0 + 16*0,67 + 21*0,33 + 26*0 + 31*0 + 36*0 = 17,67
Varianta condiționată D = 11 2 *0 + 16 2 *0,67 + 21 2 *0,33 + 26 2 *0 + 31 2 *0 + 36 2 *0 - 17,67 2 = 5,56
Legea distribuției condiționate X(Y=40).
P(X=11/Y=40) = 0/55 = 0
P(X=16/Y=40) = 0/55 = 0
P(X=21/Y=40) = 6/55 = 0,11
P(X=26/Y=40) = 45/55 = 0,82
P(X=31/Y=40) = 4/55 = 0,0727
P(X=36/Y=40) = 0/55 = 0
Așteptări matematice condiționate M = 11*0 + 16*0 + 21*0,11 + 26*0,82 + 31*0,0727 + 36*0 = 25,82
Varianta condiționată D = 11 2 *0 + 16 2 *0 + 21 2 *0,11 + 26 2 *0,82 + 31 2 *0,0727 + 36 2 *0 - 25,82 2 = 4,51
Legea distribuției condiționate X(Y=50).
P(X=11/Y=50) = 0/16 = 0
P(X=16/Y=50) = 0/16 = 0
P(X=21/Y=50) = 2/16 = 0,13
P(X=26/Y=50) = 8/16 = 0,5
P(X=31/Y=50) = 6/16 = 0,38
P(X=36/Y=50) = 0/16 = 0
Așteptări matematice condiționate M = 11*0 + 16*0 + 21*0,13 + 26*0,5 + 31*0,38 + 36*0 = 27,25
Varianta condiționată D = 11 2 *0 + 16 2 *0 + 21 2 *0,13 + 26 2 *0,5 + 31 2 *0,38 + 36 2 *0 - 27,25 2 = 10,94
Legea distribuției condiționate X(Y=60).
P(X=11/Y=60) = 0/14 = 0
P(X=16/Y=60) = 0/14 = 0
P(X=21/Y=60) = 0/14 = 0
P(X=26/Y=60) = 4/14 = 0,29
P(X=31/Y=60) = 7/14 = 0,5
P(X=36/Y=60) = 3/14 = 0,21
Așteptări matematice condiționate M = 11*0 + 16*0 + 21*0 + 26*0,29 + 31*0,5 + 36*0,21 = 30,64
Varianta condiționată D = 11 2 *0 + 16 2 *0 + 21 2 *0 + 26 2 *0,29 + 31 2 *0,5 + 36 2 *0,21 - 30,64 2 = 12,37
3. Legea distribuției condiționate Y.
Legea distribuției condiționate Y(X=11).
P(Y=20/X=11) = 2/2 = 1
P(Y=30/X=11) = 0/2 = 0
P(Y=40/X=11) = 0/2 = 0
P(Y=50/X=11) = 0/2 = 0
P(Y=60/X=11) = 0/2 = 0
Așteptări matematice condiționate M = 20*1 + 30*0 + 40*0 + 50*0 + 60*0 = 20
Varianta condiționată D = 20 2 *1 + 30 2 *0 + 40 2 *0 + 50 2 *0 + 60 2 *0 - 20 2 = 0
Legea distribuției condiționate Y(X=16).
P(Y=20/X=16) = 4/10 = 0,4
P(Y=30/X=16) = 6/10 = 0,6
P(Y=40/X=16) = 0/10 = 0
P(Y=50/X=16) = 0/10 = 0
P(Y=60/X=16) = 0/10 = 0
Așteptări matematice condiționate M = 20*0,4 + 30*0,6 + 40*0 + 50*0 + 60*0 = 26
Varianta condiționată D = 20 2 *0,4 + 30 2 *0,6 + 40 2 *0 + 50 2 *0 + 60 2 *0 - 26 2 = 24
Legea distribuției condiționate Y(X=21).
P(Y=20/X=21) = 0/11 = 0
P(Y=30/X=21) = 3/11 = 0,27
P(Y=40/X=21) = 6/11 = 0,55
P(Y=50/X=21) = 2/11 = 0,18
P(Y=60/X=21) = 0/11 = 0
Așteptări matematice condiționate M = 20*0 + 30*0,27 + 40*0,55 + 50*0,18 + 60*0 = 39,09
Varianta condiționată D = 20 2 *0 + 30 2 *0,27 + 40 2 *0,55 + 50 2 *0,18 + 60 2 *0 - 39,09 2 = 44,63
Legea distribuției condiționate Y(X=26).
P(Y=20/X=26) = 0/57 = 0
P(Y=30/X=26) = 0/57 = 0
P(Y=40/X=26) = 45/57 = 0,79
P(Y=50/X=26) = 8/57 = 0,14
P(Y=60/X=26) = 4/57 = 0,0702
Așteptări matematice condiționate M = 20*0 + 30*0 + 40*0,79 + 50*0,14 + 60*0,0702 = 42,81
Varianta condiționată D = 20 2 *0 + 30 2 *0 + 40 2 *0,79 + 50 2 *0,14 + 60 2 *0,0702 - 42,81 2 = 34,23
Legea distribuției condiționate Y(X=31).
P(Y=20/X=31) = 0/17 = 0
P(Y=30/X=31) = 0/17 = 0
P(Y=40/X=31) = 4/17 = 0,24
P(Y=50/X=31) = 6/17 = 0,35
P(Y=60/X=31) = 7/17 = 0,41
Așteptări matematice condiționate M = 20*0 + 30*0 + 40*0,24 + 50*0,35 + 60*0,41 = 51,76
Varianta condiționată D = 20 2 *0 + 30 2 *0 + 40 2 *0,24 + 50 2 *0,35 + 60 2 *0,41 - 51,76 2 = 61,59
Legea distribuției condiționate Y(X=36).
P(Y=20/X=36) = 0/3 = 0
P(Y=30/X=36) = 0/3 = 0
P(Y=40/X=36) = 0/3 = 0
P(Y=50/X=36) = 0/3 = 0
P(Y=60/X=36) = 3/3 = 1
Așteptări matematice condiționate M = 20*0 + 30*0 + 40*0 + 50*0 + 60*1 = 60
Varianta condiționată D = 20 2 *0 + 30 2 *0 + 40 2 *0 + 50 2 *0 + 60 2 *1 - 60 2 = 0
Covarianta.
cov(X,Y) = M - M[X]·M[Y]
cov(X,Y) = (20 11 2 + 20 16 4 + 30 16 6 + 30 21 3 + 40 21 6 + 50 21 2 + 40 26 45 + 50 26 8 + 60 26 4 + 40 30 3 4 + 40 31 4 6 + 60 31 7 + 60 36 3)/100 - 25,3 42,3 = 38,11
Dacă variabilele aleatoare sunt independente, atunci covarianța lor este zero. În cazul nostru, cov(X,Y) ≠ 0.
Coeficientul de corelare.


Ecuația de regresie liniară de la y la x este:

Ecuația de regresie liniară de la x la y este:

Să găsim caracteristicile numerice necesare.
Mediile eșantionului:
x = (20(2 + 4) + 30(6 + 3) + 40(6 + 45 + 4) + 50(2 + 8 + 6) + 60(4 + 7 + 3))/100 = 42,3
y = (20(2 + 4) + 30(6 + 3) + 40(6 + 45 + 4) + 50(2 + 8 + 6) + 60(4 + 7 + 3))/100 = 25,3
Variante:
σ 2 x = (20 2 (2 + 4) + 30 2 (6 + 3) + 40 2 (6 + 45 + 4) + 50 2 (2 + 8 + 6) + 60 2 (4 + 7 + 3) )/100 - 42,3 2 = 99,71
σ 2 y = (11 2 (2) + 16 2 (4 + 6) + 21 2 (3 + 6 + 2) + 26 2 (45 + 8 + 4) + 31 2 (4 + 6 + 7) + 36 2 (3))/100 - 25,3 2 = 24,01
De unde obținem abaterile standard de la:
σ x = 9,99 și σ y = 4,9
si covarianta:
Cov(x,y) = (20 11 2 + 20 16 4 + 30 16 6 + 30 21 3 + 40 21 6 + 50 21 2 + 40 26 45 + 50 26 8 + 60 26 4 + 40 30 3 4 + 40 31 4 6 + 60 31 7 + 60 36 3)/100 - 42,3 25,3 = 38,11
Să determinăm coeficientul de corelație:


Să scriem ecuațiile dreptelor de regresie y(x):

și calculând, obținem:
y x = 0,38 x + 9,14
Să scriem ecuațiile dreptelor de regresie x(y):

și calculând, obținem:
x y = 1,59 y + 2,15
Dacă trasăm punctele determinate de tabel și de liniile de regresie, vom vedea că ambele drepte trec prin punctul cu coordonatele (42.3; 25.3) iar punctele sunt situate aproape de liniile de regresie.
Semnificația coeficientului de corelație.

Folosind tabelul lui Student cu un nivel de semnificație α=0,05 și grade de libertate k=100-m-1 = 98, găsim t crit:
t crit (n-m-1;α/2) = (98;0,025) = 1,984
unde m = 1 este numărul de variabile explicative.
Dacă se observă t > t critic, atunci valoarea rezultată a coeficientului de corelație este considerată semnificativă (se respinge ipoteza nulă care afirmă că coeficientul de corelație este egal cu zero).
Deoarece t obs > t crit, respingem ipoteza că coeficientul de corelație este egal cu 0. Cu alte cuvinte, coeficientul de corelație este semnificativ statistic.

Exercita. Numărul de accesări ale perechilor de valori ale variabilelor aleatoare X și Y în intervalele corespunzătoare este dat în tabel. Folosind aceste date, găsiți coeficientul de corelație al eșantionului și ecuațiile eșantionului dreptelor de regresie ale lui Y pe X și X pe Y.
Soluţie

Exemplu. Distribuția de probabilitate a unei variabile aleatoare bidimensionale (X, Y) este dată de un tabel. Aflați legile de distribuție a mărimilor componente X, Y și coeficientul de corelație p(X, Y).
Descărcați soluția

Exercita. O mărime discretă bidimensională (X, Y) este dată de o lege de distribuție. Aflați legile de distribuție a componentelor X și Y, covarianța și coeficientul de corelație.

Să fie dată o variabilă aleatoare bidimensională $(X,Y)$.

Definiția 1

Legea distribuției unei variabile aleatoare bidimensionale $(X,Y)$ este mulțimea perechilor posibile de numere $(x_i,\ y_j)$ (unde $x_i \epsilon X,\ y_j \epsilon Y$) și a acestora probabilități $p_(ij)$ .

Cel mai adesea, legea distribuției unei variabile aleatoare bidimensionale este scrisă sub forma unui tabel (Tabelul 1).

Figura 1. Legea distribuției unei variabile aleatoare bidimensionale.

Să ne amintim acum teorema adunării probabilităților evenimentelor independente.

Teorema 1

Probabilitatea sumei unui număr finit de evenimente independente $(\A)_1$, $(\A)_2$, ... ,$\(\A)_n$ se calculează prin formula:

Folosind această formulă, puteți obține legile de distribuție pentru fiecare componentă a unei variabile aleatoare bidimensionale, adică:

De aici rezultă că suma tuturor probabilităților unui sistem bidimensional are următoarea formă:

Să luăm în considerare în detaliu (pas cu pas) problema asociată conceptului de lege de distribuție a unei variabile aleatoare bidimensionale.

Exemplul 1

Legea distribuției unei variabile aleatoare bidimensionale este dată de următorul tabel:

Figura 2.

Aflați legile de distribuție ale variabilelor aleatoare $X,\ Y$, $X+Y$ și verificați în fiecare caz dacă suma totală a probabilităților este egală cu unu.

  1. Să găsim mai întâi distribuția variabilei aleatoare $X$. Variabila aleatorie $X$ poate lua valorile $x_1=2,$ $x_2=3$, $x_3=5$. Pentru a găsi distribuția vom folosi teorema 1.

Să găsim mai întâi suma probabilităților $x_1$ după cum urmează:

Figura 3.

În mod similar, găsim $P\left(x_2\right)$ și $P\left(x_3\right)$:

\ \

Figura 4.

  1. Să găsim acum distribuția variabilei aleatoare $Y$. Variabila aleatorie $Y$ poate lua valorile $x_1=1,$ $x_2=3$, $x_3=4$. Pentru a găsi distribuția vom folosi teorema 1.

Să găsim mai întâi suma probabilităților $y_1$ după cum urmează:

Figura 5.

În mod similar, găsim $P\left(y_2\right)$ și $P\left(y_3\right)$:

\ \

Aceasta înseamnă că legea distribuției valorii $X$ are următoarea formă:

Figura 6.

Să verificăm egalitatea sumei totale de probabilități:

  1. Rămâne de găsit legea de distribuție a variabilei aleatoare $X+Y$.

Pentru comoditate, să-l notăm cu $Z$: $Z=X+Y$.

Mai întâi, să aflăm ce valori poate lua această cantitate. Pentru a face acest lucru, vom adăuga valorile $X$ și $Y$ în perechi. Obținem următoarele valori: 3, 4, 6, 5, 6, 8, 6, 7, 9. Acum, eliminând valorile potrivite, constatăm că variabila aleatoare $X+Y$ poate lua valorile $z_1 =3,\ z_2=4 ,\ z_3=5,\ z_4=6,\ z_5=7,\ z_6=8,\ z_7=9.\ $

Să găsim mai întâi $P(z_1)$. Deoarece valoarea lui $z_1$ este una, se găsește după cum urmează:

Figura 7.

Toate probabilitățile, cu excepția $P(z_4)$, se găsesc în mod similar:

Să găsim acum $P(z_4)$ după cum urmează:

Figura 8.

Aceasta înseamnă că legea distribuției valorii $Z$ are următoarea formă:

Figura 9.

Să verificăm egalitatea sumei totale de probabilități:

Definiţie. Dacă două variabile aleatoare sunt date pe același spațiu de evenimente elementare XŞi Y, apoi spun că este dat variabilă aleatoare bidimensională (X,Y) .

Exemplu. Mașina ștampilă plăci de oțel. Lungime controlată Xși lățimea Y. − SV bidimensional.

NE XŞi Y au propriile funcții de distribuție și alte caracteristici.

Definiţie. Funcția de distribuție a unei variabile aleatoare bidimensionale (X,Y) numită funcție.

Definiţie. Legea distribuției unei variabile aleatoare bidimensionale discrete (X, Y) numită masă

Pentru un SV discret bidimensional.

Proprietăți:

2) dacă , atunci ; dacă, atunci ;

4) − funcţia de distribuţie X;

− funcţia de distribuţie Y.

Probabilitatea ca valorile SV bidimensionale să cadă într-un dreptunghi:

Definiţie. Variabilă aleatoare bidimensională (X,Y) numit continuu , dacă funcția sa de distribuție este continuă și are peste tot (cu excepția, poate, un număr finit de curbe) o derivată parțială mixtă continuă de ordinul 2 .

Definiţie. Densitatea distribuției comune de probabilitate a unui SV bidimensional continuu numită funcție.

Apoi, evident .

Exemplul 1. Un SV bidimensional continuu este specificat de functia de distributie

Atunci densitatea de distribuție are forma

Exemplul 2. O SV bidimensională continuă este dată de densitatea distribuției

Să-i găsim funcția de distribuție:

Proprietăți:

3) pentru orice zonă.

Fie cunoscută densitatea distribuției comune. Apoi, densitatea de distribuție a fiecăreia dintre componentele SV bidimensionale se găsește după cum urmează:

Exemplul 2 (continuare).

Unii autori numesc densitatea de distribuție a componentelor SW bidimensionale marginal densitățile distribuției probabilităților .

Legile condiționale ale distribuției componentelor unui sistem de SV discrete.

Probabilitate condiționată, unde .

Legea distribuției condiționate a componentei X la:

X
R

În mod similar pentru , unde .

Să creăm o lege de distribuție condiționată X la Y= 2.

Apoi legea distribuției condiționate

X -1
R

Definiţie. Densitatea de distribuție condiționată a componentei X la o valoare dată Y=y numit .

Similar: .

Definiţie. Condiţional matematic așteptând SV Y discret at se numește , unde − vezi mai sus.

Prin urmare, .

Pentru continuu NE Y .

Evident, aceasta este o funcție a argumentului X. Această funcție este numită funcția de regresie a lui Y pe X .

Definit în mod similar funcția de regresie X pe Y : .

Teorema 5. (Despre funcția de distribuție a SV independente)

NE XŞi Y

Consecinţă. SV continuu XŞi Y sunt independente dacă și numai dacă .

În exemplul 1 la . Prin urmare, SV XŞi Y independent.

Caracteristicile numerice ale componentelor unei variabile aleatoare bidimensionale

Pentru SV discret:

Pentru CB continuu: .

Dispersia și abaterea standard pentru toate SV sunt determinate folosind aceleași formule cunoscute de noi:

Definiţie. Punctul se numește centru de dispersie SV bidimensional.

Definiţie. Covarianta (moment de corelare) SV se numește

Pentru SV discret: .

Pentru CB continuu: .

Formula de calcul: .

Pentru SV independente.

Inconvenientul caracteristicii este dimensiunea acesteia (pătratul unității de măsură a componentelor). Următoarea cantitate nu are acest dezavantaj.

Definiţie. Coeficientul de corelare NE XŞi Y numit

Pentru SV independente.

Pentru orice pereche de SV . Se stie ca dacă și numai dacă, când, unde.

Definiţie. NE XŞi Y sunt numite necorelate , Dacă .

Relația dintre corelație și dependența SV:

− dacă SV XŞi Y corelate, adică , atunci sunt dependente; inversul nu este adevărat;

− dacă SV XŞi Y sunt independente, atunci ; contrariul nu este adevărat.

Nota 1. Dacă NE XŞi Y distribuite conform legii normale şi , atunci sunt independente.

Nota 2. Semnificație practică ca măsură a dependenţei se justifică numai atunci când distribuţia comună a perechii este normală sau aproximativ normală. Pentru SV arbitrar XŞi Y poți ajunge la o concluzie eronată, adică Pot fi chiar şi când XŞi Y sunt legate printr-o dependență funcțională strictă.

Nota 3.În statistica matematică, corelația este o dependență probabilistică (statistică) între mărimi care, în general, nu are un caracter strict funcțional. Dependența de corelație apare atunci când una dintre mărimi depinde nu numai de a doua, ci și de un număr de factori aleatori, sau când printre condițiile de care depinde una sau cealaltă mărime, există condiții comune ambelor.

Exemplul 4. Pentru SV XŞi Y din exemplul 3 găsi .

Soluţie.

Exemplul 5. Este dată densitatea distribuției comune a SV bidimensionale.

O pereche ordonată (X, Y) de variabile aleatoare X și Y se numește o variabilă aleatoare bidimensională sau un vector aleator în spațiul bidimensional. O variabilă aleatoare bidimensională (X,Y) se mai numește și sistem de variabile aleatoare X și Y. Mulțimea tuturor valorilor posibile ale unei variabile aleatoare discrete cu probabilitățile lor se numește legea de distribuție a acestei variabile aleatoare. O variabilă aleatoare bidimensională discretă (X, Y) este considerată dată dacă legea sa de distribuție este cunoscută:

P(X=x i , Y=y j) = p ij , i=1,2...,n, j=1,2...,m

Scopul serviciului. Folosind serviciul, conform unei legi de distribuție date, puteți găsi:

  • seriile de distribuție X și Y, așteptarea matematică M[X], M[Y], varianța D[X], D[Y];
  • covarianța cov(x,y), coeficientul de corelație r x,y, seria de distribuție condiționată X, așteptarea condiționată M;
În plus, este dat răspunsul la întrebarea „variabilele aleatoare X și Y sunt dependente?”.

Instrucţiuni. Specificați dimensiunea matricei de distribuție a probabilității (număr de rânduri și coloane) și tipul acesteia. Soluția rezultată este salvată într-un fișier Word.

Exemplul nr. 1. O variabilă aleatoare discretă bidimensională are un tabel de distribuție:

Y/X 1 2 3 4
10 0 0,11 0,12 0,03
20 0 0,13 0,09 0,02
30 0,02 0,11 0,08 0,01
40 0,03 0,11 0,05 q
Aflați valoarea lui q și coeficientul de corelație al acestei variabile aleatoare.

Soluţie. Găsim valoarea lui q din condiția Σp ij = 1
Σp ij = 0,02 + 0,03 + 0,11 + … + 0,03 + 0,02 + 0,01 + q = 1
0,91+q = 1. De unde provine q = 0,09?

Folosind formula ∑P(x i,y j) = p i(j=1..n), găsim seria de distribuție X.

Așteptări M[Y].
M[y] = 1*0,05 + 2*0,46 + 3*0,34 + 4*0,15 = 2,59
Varianta D[Y] = 1 2 *0.05 + 2 2 *0.46 + 3 2 *0.34 + 4 2 *0.15 - 2.59 2 = 0.64
Abaterea standardσ(y) = sqrt(D[Y]) = sqrt(0,64) = 0,801

Covarianta cov(X,Y) = M - M[X] M[Y] = 2 10 0,11 + 3 10 0,12 + 4 10 0,03 + 2 20 0,13 + 3 20 0,09 + 4 ·20·0,02 + 1·30·0,02 + 2·30·0.11 + 3·30·0.08 + 4·30·0.01 + 1·40·0.03 + 2·40·0.11 + 3·40·0.05 + 4·40 ·0.09 - 25.2 · 2.59 = -0.068
Coeficientul de corelare r xy = cov(x,y)/σ(x)&sigma(y) = -0,068/(11,531*0,801) = -0,00736

Exemplul 2. Datele din prelucrarea statistică a informațiilor privind doi indicatori X și Y sunt reflectate în tabelul de corelare. Necesar:

  1. scrieți seriile de distribuție pentru X și Y și calculați mediile eșantionului și abaterile standard ale eșantionului pentru acestea;
  2. scrieți seria de distribuție condiționată Y/x și calculați mediile condiționate Y/x;
  3. descrieți grafic dependența mediilor condiționate Y/x de valorile X;
  4. se calculează coeficientul de corelație al eșantionului Y pe X;
  5. scrieți un eșantion de ecuație de regresie directă;
  6. descrieți geometric datele din tabelul de corelare și construiți o linie de regresie.
Soluţie. O pereche ordonată (X,Y) de variabile aleatoare X și Y se numește o variabilă aleatoare bidimensională sau un vector aleator în spațiul bidimensional. O variabilă aleatoare bidimensională (X,Y) se mai numește și un sistem de variabile aleatoare X și Y.
Setul tuturor valorilor posibile ale unei variabile aleatoare discrete cu probabilitățile lor se numește legea de distribuție a acestei variabile aleatoare.
O variabilă aleatoare bidimensională discretă (X,Y) este considerată dată dacă legea sa de distribuție este cunoscută:
P(X=x i , Y=y j) = p ij , i=1,2...,n, j=1,2..,m
X/Y20 30 40 50 60
11 2 0 0 0 0
16 4 6 0 0 0
21 0 3 6 2 0
26 0 0 45 8 4
31 0 0 4 6 7
36 0 0 0 0 3
Evenimentele (X=x i, Y=y j) formează un grup complet de evenimente, deci suma tuturor probabilităților p ij ( i=1,2...,n, j=1,2..,m) indicat în tabel este egal cu 1.
1. Dependența variabilelor aleatoare X și Y.
Găsiți seriile de distribuție X și Y.
Folosind formula ∑P(x i,y j) = p i(j=1..n), găsim seria de distribuție X. Așteptări M[Y].
M[y] = (20*6 + 30*9 + 40*55 + 50*16 + 60*14)/100 = 42,3
Varianta D[Y].
D[Y] = (20 2 *6 + 30 2 *9 + 40 2 *55 + 50 2 *16 + 60 2 *14)/100 - 42,3 2 = 99,71
Abaterea standard σ(y).

Deoarece P(X=11,Y=20) = 2≠2 6, atunci variabilele aleatoare X și Y dependente.
2. Legea distribuției condiționate X.
Legea distribuției condiționate X(Y=20).
P(X=11/Y=20) = 2/6 = 0,33
P(X=16/Y=20) = 4/6 = 0,67
P(X=21/Y=20) = 0/6 = 0
P(X=26/Y=20) = 0/6 = 0
P(X=31/Y=20) = 0/6 = 0
P(X=36/Y=20) = 0/6 = 0
Așteptări matematice condiționate M = 11*0,33 + 16*0,67 + 21*0 + 26*0 + 31*0 + 36*0 = 14,33
Varianta condiționată D = 11 2 *0,33 + 16 2 *0,67 + 21 2 *0 + 26 2 *0 + 31 2 *0 + 36 2 *0 - 14,33 2 = 5,56
Legea distribuției condiționate X(Y=30).
P(X=11/Y=30) = 0/9 = 0
P(X=16/Y=30) = 6/9 = 0,67
P(X=21/Y=30) = 3/9 = 0,33
P(X=26/Y=30) = 0/9 = 0
P(X=31/Y=30) = 0/9 = 0
P(X=36/Y=30) = 0/9 = 0
Așteptări matematice condiționate M = 11*0 + 16*0,67 + 21*0,33 + 26*0 + 31*0 + 36*0 = 17,67
Varianta condiționată D = 11 2 *0 + 16 2 *0,67 + 21 2 *0,33 + 26 2 *0 + 31 2 *0 + 36 2 *0 - 17,67 2 = 5,56
Legea distribuției condiționate X(Y=40).
P(X=11/Y=40) = 0/55 = 0
P(X=16/Y=40) = 0/55 = 0
P(X=21/Y=40) = 6/55 = 0,11
P(X=26/Y=40) = 45/55 = 0,82
P(X=31/Y=40) = 4/55 = 0,0727
P(X=36/Y=40) = 0/55 = 0
Așteptări matematice condiționate M = 11*0 + 16*0 + 21*0,11 + 26*0,82 + 31*0,0727 + 36*0 = 25,82
Varianta condiționată D = 11 2 *0 + 16 2 *0 + 21 2 *0,11 + 26 2 *0,82 + 31 2 *0,0727 + 36 2 *0 - 25,82 2 = 4,51
Legea distribuției condiționate X(Y=50).
P(X=11/Y=50) = 0/16 = 0
P(X=16/Y=50) = 0/16 = 0
P(X=21/Y=50) = 2/16 = 0,13
P(X=26/Y=50) = 8/16 = 0,5
P(X=31/Y=50) = 6/16 = 0,38
P(X=36/Y=50) = 0/16 = 0
Așteptări matematice condiționate M = 11*0 + 16*0 + 21*0,13 + 26*0,5 + 31*0,38 + 36*0 = 27,25
Varianta condiționată D = 11 2 *0 + 16 2 *0 + 21 2 *0,13 + 26 2 *0,5 + 31 2 *0,38 + 36 2 *0 - 27,25 2 = 10,94
Legea distribuției condiționate X(Y=60).
P(X=11/Y=60) = 0/14 = 0
P(X=16/Y=60) = 0/14 = 0
P(X=21/Y=60) = 0/14 = 0
P(X=26/Y=60) = 4/14 = 0,29
P(X=31/Y=60) = 7/14 = 0,5
P(X=36/Y=60) = 3/14 = 0,21
Așteptări matematice condiționate M = 11*0 + 16*0 + 21*0 + 26*0,29 + 31*0,5 + 36*0,21 = 30,64
Varianta condiționată D = 11 2 *0 + 16 2 *0 + 21 2 *0 + 26 2 *0,29 + 31 2 *0,5 + 36 2 *0,21 - 30,64 2 = 12,37
3. Legea distribuției condiționate Y.
Legea distribuției condiționate Y(X=11).
P(Y=20/X=11) = 2/2 = 1
P(Y=30/X=11) = 0/2 = 0
P(Y=40/X=11) = 0/2 = 0
P(Y=50/X=11) = 0/2 = 0
P(Y=60/X=11) = 0/2 = 0
Așteptări matematice condiționate M = 20*1 + 30*0 + 40*0 + 50*0 + 60*0 = 20
Varianta condiționată D = 20 2 *1 + 30 2 *0 + 40 2 *0 + 50 2 *0 + 60 2 *0 - 20 2 = 0
Legea distribuției condiționate Y(X=16).
P(Y=20/X=16) = 4/10 = 0,4
P(Y=30/X=16) = 6/10 = 0,6
P(Y=40/X=16) = 0/10 = 0
P(Y=50/X=16) = 0/10 = 0
P(Y=60/X=16) = 0/10 = 0
Așteptări matematice condiționate M = 20*0,4 + 30*0,6 + 40*0 + 50*0 + 60*0 = 26
Varianta condiționată D = 20 2 *0,4 + 30 2 *0,6 + 40 2 *0 + 50 2 *0 + 60 2 *0 - 26 2 = 24
Legea distribuției condiționate Y(X=21).
P(Y=20/X=21) = 0/11 = 0
P(Y=30/X=21) = 3/11 = 0,27
P(Y=40/X=21) = 6/11 = 0,55
P(Y=50/X=21) = 2/11 = 0,18
P(Y=60/X=21) = 0/11 = 0
Așteptări matematice condiționate M = 20*0 + 30*0,27 + 40*0,55 + 50*0,18 + 60*0 = 39,09
Varianta condiționată D = 20 2 *0 + 30 2 *0,27 + 40 2 *0,55 + 50 2 *0,18 + 60 2 *0 - 39,09 2 = 44,63
Legea distribuției condiționate Y(X=26).
P(Y=20/X=26) = 0/57 = 0
P(Y=30/X=26) = 0/57 = 0
P(Y=40/X=26) = 45/57 = 0,79
P(Y=50/X=26) = 8/57 = 0,14
P(Y=60/X=26) = 4/57 = 0,0702
Așteptări matematice condiționate M = 20*0 + 30*0 + 40*0,79 + 50*0,14 + 60*0,0702 = 42,81
Varianta condiționată D = 20 2 *0 + 30 2 *0 + 40 2 *0,79 + 50 2 *0,14 + 60 2 *0,0702 - 42,81 2 = 34,23
Legea distribuției condiționate Y(X=31).
P(Y=20/X=31) = 0/17 = 0
P(Y=30/X=31) = 0/17 = 0
P(Y=40/X=31) = 4/17 = 0,24
P(Y=50/X=31) = 6/17 = 0,35
P(Y=60/X=31) = 7/17 = 0,41
Așteptări matematice condiționate M = 20*0 + 30*0 + 40*0,24 + 50*0,35 + 60*0,41 = 51,76
Varianta condiționată D = 20 2 *0 + 30 2 *0 + 40 2 *0,24 + 50 2 *0,35 + 60 2 *0,41 - 51,76 2 = 61,59
Legea distribuției condiționate Y(X=36).
P(Y=20/X=36) = 0/3 = 0
P(Y=30/X=36) = 0/3 = 0
P(Y=40/X=36) = 0/3 = 0
P(Y=50/X=36) = 0/3 = 0
P(Y=60/X=36) = 3/3 = 1
Așteptări matematice condiționate M = 20*0 + 30*0 + 40*0 + 50*0 + 60*1 = 60
Varianta condiționată D = 20 2 *0 + 30 2 *0 + 40 2 *0 + 50 2 *0 + 60 2 *1 - 60 2 = 0
Covarianta.
cov(X,Y) = M - M[X]·M[Y]
cov(X,Y) = (20 11 2 + 20 16 4 + 30 16 6 + 30 21 3 + 40 21 6 + 50 21 2 + 40 26 45 + 50 26 8 + 60 26 4 + 40 30 3 4 + 40 31 4 6 + 60 31 7 + 60 36 3)/100 - 25,3 42,3 = 38,11
Dacă variabilele aleatoare sunt independente, atunci covarianța lor este zero. În cazul nostru, cov(X,Y) ≠ 0.
Coeficientul de corelare.


Ecuația de regresie liniară de la y la x este:

Ecuația de regresie liniară de la x la y este:

Să găsim caracteristicile numerice necesare.
Mediile eșantionului:
x = (20(2 + 4) + 30(6 + 3) + 40(6 + 45 + 4) + 50(2 + 8 + 6) + 60(4 + 7 + 3))/100 = 42,3
y = (20(2 + 4) + 30(6 + 3) + 40(6 + 45 + 4) + 50(2 + 8 + 6) + 60(4 + 7 + 3))/100 = 25,3
Variante:
σ 2 x = (20 2 (2 + 4) + 30 2 (6 + 3) + 40 2 (6 + 45 + 4) + 50 2 (2 + 8 + 6) + 60 2 (4 + 7 + 3) )/100 - 42,3 2 = 99,71
σ 2 y = (11 2 (2) + 16 2 (4 + 6) + 21 2 (3 + 6 + 2) + 26 2 (45 + 8 + 4) + 31 2 (4 + 6 + 7) + 36 2 (3))/100 - 25,3 2 = 24,01
De unde obținem abaterile standard de la:
σ x = 9,99 și σ y = 4,9
si covarianta:
Cov(x,y) = (20 11 2 + 20 16 4 + 30 16 6 + 30 21 3 + 40 21 6 + 50 21 2 + 40 26 45 + 50 26 8 + 60 26 4 + 40 30 3 4 + 40 31 4 6 + 60 31 7 + 60 36 3)/100 - 42,3 25,3 = 38,11
Să determinăm coeficientul de corelație:


Să scriem ecuațiile dreptelor de regresie y(x):

și calculând, obținem:
y x = 0,38 x + 9,14
Să scriem ecuațiile dreptelor de regresie x(y):

și calculând, obținem:
x y = 1,59 y + 2,15
Dacă trasăm punctele determinate de tabel și de liniile de regresie, vom vedea că ambele drepte trec prin punctul cu coordonatele (42.3; 25.3) iar punctele sunt situate aproape de liniile de regresie.
Semnificația coeficientului de corelație.

Folosind tabelul lui Student cu un nivel de semnificație α=0,05 și grade de libertate k=100-m-1 = 98, găsim t crit:
t crit (n-m-1;α/2) = (98;0,025) = 1,984
unde m = 1 este numărul de variabile explicative.
Dacă se observă t > t critic, atunci valoarea rezultată a coeficientului de corelație este considerată semnificativă (se respinge ipoteza nulă care afirmă că coeficientul de corelație este egal cu zero).
Deoarece t obs > t crit, respingem ipoteza că coeficientul de corelație este egal cu 0. Cu alte cuvinte, coeficientul de corelație este semnificativ statistic.

Exercita. Numărul de accesări ale perechilor de valori ale variabilelor aleatoare X și Y în intervalele corespunzătoare este dat în tabel. Folosind aceste date, găsiți coeficientul de corelație al eșantionului și ecuațiile eșantionului dreptelor de regresie ale lui Y pe X și X pe Y.
Soluţie

Exemplu. Distribuția de probabilitate a unei variabile aleatoare bidimensionale (X, Y) este dată de un tabel. Aflați legile de distribuție a mărimilor componente X, Y și coeficientul de corelație p(X, Y).
Descărcați soluția

Exercita. O mărime discretă bidimensională (X, Y) este dată de o lege de distribuție. Aflați legile de distribuție a componentelor X și Y, covarianța și coeficientul de corelație.

Definiția 2.7. este o pereche de numere aleatoare (X, Y), sau un punct pe planul de coordonate (Fig. 2.11).

Orez. 2.11.

O variabilă aleatoare bidimensională este un caz special de variabilă aleatoare multivariată sau vector aleator.

Definiția 2.8. Vector aleatoriu - este o funcție aleatoare?,(/) cu un set finit de valori posibile ale argumentelor t, a cărui valoare pentru orice valoare t este o variabilă aleatorie.

O variabilă aleatoare bidimensională se numește continuă dacă coordonatele sale sunt continue și discretă dacă coordonatele sale sunt discrete.

A stabili legea distribuției variabilelor aleatoare bidimensionale înseamnă a stabili o corespondență între valorile posibile ale acesteia și probabilitatea acestor valori. Conform metodelor de precizare, variabilele aleatoare sunt împărțite în continue și discrete, deși există metode generale cu precizarea legii de distribuire a oricărui SV.

Variabilă aleatoare bidimensională discretă

O variabilă aleatoare bidimensională discretă este specificată folosind un tabel de distribuție (Tabelul 2.1).

Tabelul 2.1

Tabel de distribuție (distribuție comună) SV ( X, U)

Elementele tabelului sunt determinate de formula

Proprietățile elementelor tabelului de distribuție:

Distribuția pe fiecare coordonată este numită unidimensional sau marginal:

r 1> = P(X =.g,) - distribuția marginală a SV X;

p^2) = P(Y= y,)- distribuția marginală a SV U.

Relația dintre distribuția comună a OC Xși Y, specificate de un set de probabilități [p()], adică = 1,..., n,j = 1,..., T(tabel de distribuție) și distribuție marginală.


La fel și pentru SV U p- 2)= X r, g

Problema 2.14. Dat:

Variabilă aleatoare bidimensională continuă

/(X, y)dxdy- element de probabilitate pentru o variabilă aleatoare bidimensională (X, Y) - probabilitatea ca o variabilă aleatoare (X, Y) să cadă într-un dreptunghi cu laturi cbc, dy la dx, dy -* 0:

f(x, y) - densitatea distributiei variabilă aleatoare bidimensională (X, Y). Sarcina /(x, y) dăm informatii complete asupra distribuţiei unei variabile aleatoare bidimensionale.

Distribuțiile marginale sunt specificate după cum urmează: pentru X - prin densitatea de distribuție a SV X/,(x); De Y- densitatea de distribuție a SV U f>(y).

Specificarea legii de distribuție a unei variabile aleatoare bidimensionale prin funcția de distribuție

O modalitate universală de a specifica legea distribuției pentru o variabilă aleatoare bidimensională discretă sau continuă este funcția de distribuție F(x, y).

Definiția 2.9. Funcția de distribuție F(x, y)- probabilitatea producerii comune a evenimentelor (Xy), i.e. F(x 0 ,y n) = = P(X y), aruncat pe planul de coordonate, se încadrează într-un cadran infinit cu vârful în punctul M(x 0, y i)(în zona umbrită din fig. 2.12).

Orez. 2.12. Ilustrație a funcției de distribuție F( x, y)

Proprietățile funcției F(x, y)

  • 1) 0 1;
  • 2) F(-oo,-oo) = F(x,-oo) = F(-oo, y) = 0; F( oo, oo) = 1;
  • 3) F(x, y)- nedescrescătoare pentru fiecare argument;
  • 4) F(x, y) - continuă în stânga și dedesubt;
  • 5) consistența distribuțiilor:

F(x, X: F(x, oo) = F,(x); F(y, oo) - distribuţie marginală peste Y F( Oh, y) = F 2 (y). Conexiune /(x, y) Cu F(x, y):

Relația dintre densitatea articulației și densitatea marginală. Dana f(x, y). Să obținem densitățile de distribuție marginală f(x),f 2 (y)”.


Cazul coordonatelor independente ale unei variabile aleatoare bidimensionale

Definiția 2.10. NE XŞi Independent de Y(nz), dacă orice evenimente asociate cu fiecare dintre aceste SV sunt independente. Din definiția NZ SV rezultă:

  • 1 )Pij = p X) pf
  • 2 )F(x,y) = F l (x)F 2 (y).

Se pare că pentru SV independenți XŞi Y finalizat și

3 )f(x,y) = J(x)f,(y).

Să demonstrăm asta pentru SV independenți XŞi Y 2) 3). dovada, a) Fie satisfăcut 2, i.e.

în același timp F(x,y) = f J f(u,v)dudv, deci urmează 3);

b) să se împlinească acum 3) atunci


aceste. adevărat 2).

Să luăm în considerare sarcinile.

Problema 2.15. Distribuția este dată de următorul tabel:

Construim distribuții marginale:

Primim P(X = 3, U = 4) = 0,17 * P(X = 3)P(U = 4) = 0,1485 => => SV Xși Dependent.

Funcția de distribuție:


Problema 2.16. Distribuția este dată de următorul tabel:

Primim P tl = 0,2 0,3 = 0,06; R12 = 0,2? 0,7 = 0,14; P2l = 0,8 ? 0,3 = = 0,24; R 22 - 0,8 0,7 = 0,56 => NE XŞi Y nz.

Problema 2.17. Dana /(x, y) = 1 exp| -0,5(d" + 2xy + 5g/ 2)]. Găsi Oh)Şi /Da)-

Soluţie

(numara-l singur).