Dvodimenzionalni slučajni. 2D slučajna varijabla

Uređeni par (X , Y) slučajnih varijabli X i Y naziva se dvodimenzionalna slučajna varijabla ili slučajni vektor dvodimenzionalnog prostora. Dvodimenzionalna slučajna varijabla (X,Y) također se naziva sustavom slučajnih varijabli X i Y. Skup svih mogućih vrijednosti diskretne slučajne varijable s njihovim vjerojatnostima naziva se zakon distribucije ove slučajne varijable. Diskretna dvodimenzionalna slučajna varijabla (X, Y) smatra se danom ako je poznat njen zakon distribucije:

P(X=x i , Y=y j) = p ij , i=1,2...,n, j=1,2...,m

Zadatak usluge. Korištenjem usluge, prema datom zakonu o distribuciji, možete pronaći:

  • distribucijski nizovi X i Y, matematičko očekivanje M[X], M[Y], varijanca D[X], D[Y];
  • kovarijansa cov(x,y), koeficijent korelacije r x,y , niz uvjetne distribucije X, uvjetno očekivanje M;
Osim toga, daje se odgovor na pitanje: "Jesu li slučajne varijable X i Y ovisne?".

Uputa. Odredite dimenziju matrice distribucije vjerojatnosti (broj redaka i stupaca) i njen oblik. Dobiveno rješenje sprema se u Word datoteku.

Primjer #1. Dvodimenzionalna diskretna slučajna varijabla ima tablicu distribucije:

Y/X 1 2 3 4
10 0 0,11 0,12 0,03
20 0 0,13 0,09 0,02
30 0,02 0,11 0,08 0,01
40 0,03 0,11 0,05 q
Pronađite vrijednost q i koeficijent korelacije ove slučajne varijable.

Odluka. Vrijednost q nalazimo iz uvjeta Σp ij = 1
Σp ij = 0,02 + 0,03 + 0,11 + … + 0,03 + 0,02 + 0,01 + q = 1
0,91+q = 1. Odakle je q = 0,09

Koristeći formulu ∑P(x i,y j) = str i(j=1..n), pronađite red raspodjele X.

matematičko očekivanje M[Y].
M[y] = 1*0,05 + 2*0,46 + 3*0,34 + 4*0,15 = 2,59
disperzija D[Y] = 1 2 *0.05 + 2 2 *0.46 + 3 2 *0.34 + 4 2 *0.15 - 2.59 2 = 0.64
Standardna devijacijaσ(y) = sqrt(D[Y]) = sqrt(0,64) = 0,801

kovarijanca cov(X,Y) = M - M[X] M[Y] = 2 10 0,11 + 3 10 0,12 + 4 10 0,03 + 2 20 0,13 + 3 20 0,09 + 4 20 0,02 + 1 30 0,02 + 0. 3 30 0,08 + 4 30 0,01 + 1 40 0,03 + 2 40 0,11 + 3 40 0,05 + 4 40 0,09 - 25,2 2,59 = -0,068
Koeficijent korelacije rxy = cov(x,y)/σ(x)&sigma(y) = -0,068/(11,531*0,801) = -0,00736

Primjer 2 . Podaci statističke obrade informacija za dva pokazatelja X i Y prikazani su u korelacijskoj tablici. Potreban:

  1. napisati redove distribucije za X i Y i izračunati srednje vrijednosti uzorka i standardne devijacije uzorka za njih;
  2. napisati niz uvjetne distribucije Y/x i izračunati uvjetne prosjeke Y/x;
  3. grafički prikazati ovisnost uvjetnih prosjeka Y/x o vrijednostima X;
  4. izračunati koeficijent korelacije uzorka Y na X;
  5. napisati uzorak jednadžbe izravne regresije;
  6. geometrijski predstaviti podatke korelacijske tablice i izgraditi regresijsku liniju.
Odluka. Uređeni par (X,Y) slučajnih varijabli X i Y naziva se dvodimenzionalna slučajna varijabla ili slučajni vektor dvodimenzionalnog prostora. Dvodimenzionalna slučajna varijabla (X,Y) također se naziva sustavom slučajnih varijabli X i Y.
Skup svih mogućih vrijednosti diskretne slučajne varijable s njihovim vjerojatnostima naziva se zakon distribucije ove slučajne varijable.
Diskretna dvodimenzionalna slučajna varijabla (X,Y) smatra se danom ako je poznat njen zakon distribucije:
P(X=x i , Y=y j) = p ij , i=1,2...,n, j=1,2...,m
X/Y20 30 40 50 60
11 2 0 0 0 0
16 4 6 0 0 0
21 0 3 6 2 0
26 0 0 45 8 4
31 0 0 4 6 7
36 0 0 0 0 3
Događaji (X=x i , Y=y j) čine kompletnu grupu događaja, pa je zbroj svih vjerojatnosti p ij ( i=1,2...,n, j=1,2...,m) naveden u tablici jednak je 1.
1. Ovisnost slučajnih varijabli X i Y.
Pronađite nizove distribucije X i Y.
Koristeći formulu ∑P(x i,y j) = str i(j=1..n), pronađite red raspodjele X. matematičko očekivanje M[Y].
M[y] = (20*6 + 30*9 + 40*55 + 50*16 + 60*14)/100 = 42,3
disperzija D[Y].
D[Y] = (20 2 *6 + 30 2 *9 + 40 2 *55 + 50 2 *16 + 60 2 *14)/100 - 42,3 2 = 99,71
Standardna devijacija σ(y).

Budući da je P(X=11,Y=20) = 2≠2 6, onda su slučajne varijable X i Y ovisni.
2. Zakon uvjetne raspodjele X.
Zakon uvjetne distribucije X(Y=20).
P(X=11/Y=20) = 2/6 = 0,33
P(X=16/Y=20) = 4/6 = 0,67
P(X=21/Y=20) = 0/6 = 0
P(X=26/Y=20) = 0/6 = 0
P(X=31/Y=20) = 0/6 = 0
P(X=36/Y=20) = 0/6 = 0
Uvjetno očekivanje M = 11*0,33 + 16*0,67 + 21*0 + 26*0 + 31*0 + 36*0 = 14,33
Uvjetna varijanca D = 11 2 *0,33 + 16 2 *0,67 + 21 2 *0 + 26 2 *0 + 31 2 *0 + 36 2 *0 - 14,33 2 = 5,56
Zakon uvjetne distribucije X(Y=30).
P(X=11/Y=30) = 0/9 = 0
P(X=16/Y=30) = 6/9 = 0,67
P(X=21/Y=30) = 3/9 = 0,33
P(X=26/Y=30) = 0/9 = 0
P(X=31/Y=30) = 0/9 = 0
P(X=36/Y=30) = 0/9 = 0
Uvjetno očekivanje M = 11*0 + 16*0,67 + 21*0,33 + 26*0 + 31*0 + 36*0 = 17,67
Uvjetna varijanca D = 11 2 *0 + 16 2 *0,67 + 21 2 *0,33 + 26 2 *0 + 31 2 *0 + 36 2 *0 - 17,67 2 = 5,56
Zakon uvjetne distribucije X(Y=40).
P(X=11/Y=40) = 0/55 = 0
P(X=16/Y=40) = 0/55 = 0
P(X=21/Y=40) = 6/55 = 0,11
P(X=26/Y=40) = 45/55 = 0,82
P(X=31/Y=40) = 4/55 = 0,0727
P(X=36/Y=40) = 0/55 = 0
Uvjetno očekivanje M = 11*0 + 16*0 + 21*0,11 + 26*0,82 + 31*0,0727 + 36*0 = 25,82
Uvjetna varijanca D = 11 2 *0 + 16 2 *0 + 21 2 *0,11 + 26 2 *0,82 + 31 2 *0,0727 + 36 2 *0 - 25,82 2 = 4,51
Zakon uvjetne distribucije X(Y=50).
P(X=11/Y=50) = 0/16 = 0
P(X=16/Y=50) = 0/16 = 0
P(X=21/Y=50) = 2/16 = 0,13
P(X=26/Y=50) = 8/16 = 0,5
P(X=31/Y=50) = 6/16 = 0,38
P(X=36/Y=50) = 0/16 = 0
Uvjetno očekivanje M = 11*0 + 16*0 + 21*0,13 + 26*0,5 + 31*0,38 + 36*0 = 27,25
Uvjetna varijanca D = 11 2 *0 + 16 2 *0 + 21 2 *0,13 + 26 2 *0,5 + 31 2 *0,38 + 36 2 *0 - 27,25 2 = 10,94
Zakon uvjetne distribucije X(Y=60).
P(X=11/Y=60) = 0/14 = 0
P(X=16/Y=60) = 0/14 = 0
P(X=21/Y=60) = 0/14 = 0
P(X=26/Y=60) = 4/14 = 0,29
P(X=31/Y=60) = 7/14 = 0,5
P(X=36/Y=60) = 3/14 = 0,21
Uvjetno očekivanje M = 11*0 + 16*0 + 21*0 + 26*0,29 + 31*0,5 + 36*0,21 = 30,64
Uvjetna varijanca D = 11 2 *0 + 16 2 *0 + 21 2 *0 + 26 2 *0,29 + 31 2 *0,5 + 36 2 *0,21 - 30,64 2 = 12,37
3. Zakon uvjetne raspodjele Y.
Zakon uvjetne distribucije Y(X=11).
P(Y=20/X=11) = 2/2 = 1
P(Y=30/X=11) = 0/2 = 0
P(Y=40/X=11) = 0/2 = 0
P(Y=50/X=11) = 0/2 = 0
P(Y=60/X=11) = 0/2 = 0
Uvjetno očekivanje M = 20*1 + 30*0 + 40*0 + 50*0 + 60*0 = 20
Uvjetna varijanca D = 20 2 *1 + 30 2 *0 + 40 2 *0 + 50 2 *0 + 60 2 *0 - 20 2 = 0
Zakon uvjetne distribucije Y(X=16).
P(Y=20/X=16) = 4/10 = 0,4
P(Y=30/X=16) = 6/10 = 0,6
P(Y=40/X=16) = 0/10 = 0
P(Y=50/X=16) = 0/10 = 0
P(Y=60/X=16) = 0/10 = 0
Uvjetno očekivanje M = 20*0,4 + 30*0,6 + 40*0 + 50*0 + 60*0 = 26
Uvjetna varijanca D = 20 2 *0,4 + 30 2 *0,6 + 40 2 *0 + 50 2 *0 + 60 2 *0 - 26 2 = 24
Zakon uvjetne distribucije Y(X=21).
P(Y=20/X=21) = 0/11 = 0
P(Y=30/X=21) = 3/11 = 0,27
P(Y=40/X=21) = 6/11 = 0,55
P(Y=50/X=21) = 2/11 = 0,18
P(Y=60/X=21) = 0/11 = 0
Uvjetno očekivanje M = 20*0 + 30*0,27 + 40*0,55 + 50*0,18 + 60*0 = 39,09
Uvjetna varijanca D = 20 2 *0 + 30 2 *0,27 + 40 2 *0,55 + 50 2 *0,18 + 60 2 *0 - 39,09 2 = 44,63
Zakon uvjetne distribucije Y(X=26).
P(Y=20/X=26) = 0/57 = 0
P(Y=30/X=26) = 0/57 = 0
P(Y=40/X=26) = 45/57 = 0,79
P(Y=50/X=26) = 8/57 = 0,14
P(Y=60/X=26) = 4/57 = 0,0702
Uvjetno očekivanje M = 20*0 + 30*0 + 40*0,79 + 50*0,14 + 60*0,0702 = 42,81
Uvjetna varijanca D = 20 2 *0 + 30 2 *0 + 40 2 *0,79 + 50 2 *0,14 + 60 2 *0,0702 - 42,81 2 = 34,23
Zakon uvjetne distribucije Y(X=31).
P(Y=20/X=31) = 0/17 = 0
P(Y=30/X=31) = 0/17 = 0
P(Y=40/X=31) = 4/17 = 0,24
P(Y=50/X=31) = 6/17 = 0,35
P(Y=60/X=31) = 7/17 = 0,41
Uvjetno očekivanje M = 20*0 + 30*0 + 40*0,24 + 50*0,35 + 60*0,41 = 51,76
Uvjetna varijanca D = 20 2 *0 + 30 2 *0 + 40 2 *0,24 + 50 2 *0,35 + 60 2 *0,41 - 51,76 2 = 61,59
Zakon uvjetne distribucije Y(X=36).
P(Y=20/X=36) = 0/3 = 0
P(Y=30/X=36) = 0/3 = 0
P(Y=40/X=36) = 0/3 = 0
P(Y=50/X=36) = 0/3 = 0
P(Y=60/X=36) = 3/3 = 1
Uvjetno očekivanje M = 20*0 + 30*0 + 40*0 + 50*0 + 60*1 = 60
Uvjetna varijanca D = 20 2 *0 + 30 2 *0 + 40 2 *0 + 50 2 *0 + 60 2 *1 - 60 2 = 0
kovarijanca.
cov(X,Y) = M - M[X] M[Y]
cov(X,Y) = (20 11 2 + 20 16 4 + 30 16 6 + 30 21 3 + 40 21 6 + 50 21 2 + 40 26 45 + 50 26 8 + 60 26 4 + 40 50 3 6 + 60 31 7 + 60 36 3)/100 - 25,3 42,3 = 38,11
Ako su slučajne varijable neovisne, onda je njihova kovarijansa nula. U našem slučaju cov(X,Y) ≠ 0.
Koeficijent korelacije.


Jednadžba linearne regresije od y do x je:

Jednadžba linearne regresije od x do y je:

Pronađite potrebne numeričke karakteristike.
Uzorak znači:
x = (20(2 + 4) + 30(6 + 3) + 40(6 + 45 + 4) + 50(2 + 8 + 6) + 60(4 + 7 + 3))/100 = 42,3
y = (20(2 + 4) + 30(6 + 3) + 40(6 + 45 + 4) + 50(2 + 8 + 6) + 60(4 + 7 + 3))/100 = 25,3
disperzije:
σ 2 x = (20 2 (2 + 4) + 30 2 (6 + 3) + 40 2 (6 + 45 + 4) + 50 2 (2 + 8 + 6) + 60 2 (4 + 7 + 3)) )/100 - 42,3 2 = 99,71
σ 2 y = (11 2 (2) + 16 2 (4 + 6) + 21 2 (3 + 6 + 2) + 26 2 (45 + 8 + 4) + 31 2 (4 + 6 + 7) + 36) 2 (3))/100 - 25,3 2 = 24,01
Gdje dobivamo standardne devijacije:
σ x = 9,99 i σ y = 4,9
i kovarijansa:
Cov(x,y) = (20 11 2 + 20 16 4 + 30 16 6 + 30 21 3 + 40 21 6 + 50 21 2 + 40 26 45 + 50 26 8 + 60 26 4 + 40 50 3 6 + 60 31 7 + 60 36 3)/100 - 42,3 25,3 = 38,11
Definirajmo koeficijent korelacije:


Zapišimo jednadžbe regresijskih linija y(x):

a računajući, dobivamo:
yx = 0,38x + 9,14
Zapišimo jednadžbe regresijskih linija x(y):

a računajući, dobivamo:
x y = 1,59 y + 2,15
Ako izgradimo točke definirane tablicom i regresijskim linijama, vidjet ćemo da obje linije prolaze kroz točku s koordinatama (42.3; 25.3), a točke se nalaze blizu regresijskih linija.
Značaj koeficijenta korelacije.

Prema Studentovoj tablici s razinom značajnosti α=0,05 i stupnjevima slobode k=100-m-1 = 98 nalazimo t crit:
t crit (n-m-1;α/2) = (98;0,025) = 1,984
gdje je m = 1 broj eksplanatornih varijabli.
Ako je t obs > t kritično, tada se dobivena vrijednost koeficijenta korelacije prepoznaje kao značajna (odbacuje se nulta hipoteza koja tvrdi da je koeficijent korelacije jednak nuli).
Budući da je t obl > t crit, odbacujemo hipotezu da je koeficijent korelacije jednak 0. Drugim riječima, koeficijent korelacije je statistički značajan.

Vježbajte. Broj pogodaka parova vrijednosti slučajnih varijabli X i Y u odgovarajućim intervalima dat je u tablici. Iz ovih podataka pronađite koeficijent korelacije uzorka i jednadžbe uzorka ravnih regresijskih linija Y na X i X na Y .
Odluka

Primjer. Raspodjela vjerojatnosti dvodimenzionalne slučajne varijable (X, Y) dana je tablicom. Naći zakone raspodjele komponentnih veličina X, Y i koeficijent korelacije p(X, Y).
Preuzmite Rješenje

Vježbajte. Dvodimenzionalna diskretna vrijednost (X, Y) dana je zakonom raspodjele. Naći zakone raspodjele X i Y komponenti, kovarijaciju i koeficijent korelacije.

Neka je zadana dvodimenzionalna slučajna varijabla $(X,Y)$.

Definicija 1

Zakon distribucije dvodimenzionalne slučajne varijable $(X,Y)$ skup je mogućih parova brojeva $(x_i,\ y_j)$ (gdje je $x_i \epsilon X,\ y_j \epsilon Y$) i njihovih vjerojatnosti $p_(ij)$ .

Najčešće se zakon distribucije dvodimenzionalne slučajne varijable zapisuje u obliku tablice (tablica 1.).

Slika 1. Zakon distribucije dvodimenzionalne slučajne varijable.

Sjetimo se sada teorem o zbrajanju vjerojatnosti neovisnih događaja.

Teorem 1

Vjerojatnost zbroja konačnog broja neovisnih događaja $(\ A)_1$, $(\ A)_2$, ... ,$\ (\ A)_n$ izračunava se po formuli:

Koristeći ovu formulu, može se dobiti zakon distribucije za svaku komponentu dvodimenzionalne slučajne varijable, to jest:

Odavde slijedi da zbroj svih vjerojatnosti dvodimenzionalnog sustava ima sljedeći oblik:

Razmotrimo detaljno (korak po korak) problem povezan s konceptom zakona distribucije dvodimenzionalne slučajne varijable.

Primjer 1

Zakon distribucije dvodimenzionalne slučajne varijable dan je sljedećom tablicom:

Slika 2.

Pronađite zakone raspodjele slučajnih varijabli $X,\ Y$, $X+Y$ i provjerite u svakom slučaju da je ukupan zbroj vjerojatnosti jednak jedan.

  1. Najprije pronađimo distribuciju slučajne varijable $X$. Slučajna varijabla $X$ može imati vrijednosti $x_1=2,$ $x_2=3$, $x_3=5$. Da bismo pronašli distribuciju, koristit ćemo teorem 1.

Najprije pronađimo zbroj vjerojatnosti $x_1$ na sljedeći način:

Slika 3

Slično, nalazimo $P\left(x_2\right)$ i $P\left(x_3\right)$:

\ \

Slika 4

  1. Nađimo sada distribuciju slučajne varijable $Y$. Slučajna varijabla $Y$ može imati vrijednosti $x_1=1,$ $x_2=3$, $x_3=4$. Da bismo pronašli distribuciju, koristit ćemo teorem 1.

Najprije pronađimo zbroj vjerojatnosti $y_1$ na sljedeći način:

Slika 5

Slično, nalazimo $P\left(y_2\right)$ i $P\left(y_3\right)$:

\ \

Dakle, zakon raspodjele količine $X$ ima sljedeći oblik:

Slika 6

Provjerimo ispunjenje jednakosti ukupnog zbroja vjerojatnosti:

  1. Ostaje pronaći zakon raspodjele slučajne varijable $X+Y$.

Označimo ga radi praktičnosti kroz $Z$: $Z=X+Y$.

Prvo, otkrijmo koje vrijednosti ova količina može imati. Da bismo to učinili, u paru ćemo dodati vrijednosti $X$ i $Y$. Dobivamo sljedeće vrijednosti: 3, 4, 6, 5, 6, 8, 6, 7, 9. Sada, odbacivanjem podudarnih vrijednosti, dobivamo da slučajna varijabla $X+Y$ može uzeti vrijednosti $z_1 =3,\ z_2=4 ,\ z_3=5,\ z_4=6,\ z_5=7,\ z_6=8,\ z_7=9.\ $

Prvo, pronađimo $P(z_1)$. Budući da je vrijednost $z_1$ jednostruka, nalazi se na sljedeći način:

Slika 7

Sve se vjerojatnosti nalaze na sličan način, osim za $P(z_4)$:

Pronađimo sada $P(z_4)$ na sljedeći način:

Slika 8

Dakle, zakon distribucije za $Z$ ima sljedeći oblik:

Slika 9

Provjerimo ispunjenje jednakosti ukupnog zbroja vjerojatnosti:

Definicija. Ako su dvije slučajne varijable zadane na istom prostoru elementarnih događaja x i Y, onda kažu da je dano dvodimenzionalna slučajna varijabla (X,Y) .

Primjer. Stroj štanca čelične pločice. Kontrolirana duljina x i širina Y. − dvodimenzionalni SW.

SW x i Y imaju svoje funkcije distribucije i druge karakteristike.

Definicija. Funkcija distribucije dvodimenzionalne slučajne varijable (X, Y) naziva se funkcija.

Definicija. Zakon distribucije diskretne dvodimenzionalne slučajne varijable (X, Y) zove stol

Za dvodimenzionalni diskretni SW .

Svojstva :

2) ako , onda ; ako tada ;

4) − funkcija distribucije x;

− funkcija distribucije Y.

Vjerojatnost pogađanja vrijednosti dvodimenzionalnog SW-a u pravokutniku:

Definicija. 2D slučajna varijabla (X,Y) pozvao stalan ako je njegova distribucijska funkcija je kontinuiran na i svugdje (s mogućim izuzetkom konačnog broja krivulja) ima kontinuirani mješoviti parcijalni izvod 2. reda .

Definicija. Gustoća zajedničke distribucije vjerojatnosti dvodimenzionalnog kontinuiranog SW naziva se funkcija.

Onda očito .

Primjer 1 Dvodimenzionalni kontinuirani SW zadan je funkcijom distribucije

Tada gustoća raspodjele ima oblik

Primjer 2 Dvodimenzionalni kontinuirani SW zadan je gustoćom distribucije

Nađimo njegovu funkciju distribucije:

Svojstva :

3) za bilo koje područje.

Neka je poznata gustoća raspodjele zglobova. Tada se gustoća raspodjele svake od komponenti dvodimenzionalnog SW-a nalazi na sljedeći način:

Primjer 2 (nastavak).

Neki autori nazivaju gustoće distribucije dvodimenzionalnih komponenti SW marginalni gustoće distribucije vjerojatnosti .

Uvjetni zakoni distribucije komponenti sustava diskretnih RV.

Uvjetna vjerojatnost , gdje je .

Zakon uvjetne raspodjele komponente x u:

x
R

Slično za , gdje .

Napravimo uvjetni zakon raspodjele x na Y= 2.

Zatim zakon uvjetne raspodjele

x -1
R

Definicija. Uvjetna gustoća raspodjele X komponente na zadanu vrijednost Y=y zove .

Slično: .

Definicija. uvjetno matematički čeka se diskretni SW Y at se zove , gdje − vidi gore.

Stoga, .

Za stalan SW Y .

Očito je funkcija argumenta x. Ova funkcija se zove regresijska funkcija Y na X .

Slično definirano x-on-y regresijska funkcija : .

Teorem 5. (O funkciji distribucije neovisnih RV)

SW x i Y

Posljedica. Kontinuirani SW x i Y su neovisni ako i samo ako .

U primjeru 1 s . Stoga, SW x i Y neovisna.

Numeričke karakteristike komponenti dvodimenzionalne slučajne varijable

Za diskretni CB:

Za kontinuirani SW: .

Disperzija i standardna devijacija za sve SW određuju se istim nama poznatim formulama:

Definicija. Točka se zove centar raspršenja dvodimenzionalni SW.

Definicija. Kovarijansa (korelacijski trenutak) NE se zove

Za diskretni SW: .

Za kontinuirani SW: .

Formula za izračun: .

Za nezavisne CB-ove.

Neugodnost karakteristike je njezina dimenzija (kvadrat mjerne jedinice komponenti). Sljedeća količina je slobodna od ovog nedostatka.

Definicija. Koeficijent korelacije SW x i Y pozvao

Za nezavisne CB-ove.

Za bilo koji par SW . Poznato je da ako i samo ako , gdje .

Definicija. SW x i Y pozvao nekorelirano , ako .

Odnos između korelacije i ovisnosti SW:

− ako je CB x i Y korelirani, tj. , onda su ovisni; obrnuto nije istina;

− ako je CB x i Y neovisno, dakle ; suprotno nije istina.

Napomena 1. Ako SW x i Y raspoređeni prema normalnom zakonu i , onda su neovisni.

Napomena 2. Praktična vrijednost kao mjera ovisnosti opravdana je samo kada je zajednička raspodjela para normalna ili približno normalna. Za proizvoljni SW x i Y možete doći do pogrešnog zaključka, t.j. može biti čak i kada x i Y povezan sa strogim funkcionalnim odnosom.

Napomena 3. U matematičkoj statistici korelacija je probabilistička (statistička) ovisnost između veličina koja, općenito govoreći, nema strogo funkcionalni karakter. Korelaciona ovisnost nastaje kada jedna od veličina ovisi ne samo o zadanoj sekundi, već i o nizu slučajnih čimbenika, ili kada među uvjetima o kojima ovisi jedna ili druga veličina postoje uvjeti zajednički za oboje.

Primjer 4 Za SW x i Y iz primjera 3 pronađite .

Odluka.

Primjer 5 Zadana je zajednička distribucijska gustoća dvodimenzionalnog SW-a.

Uređeni par (X , Y) slučajnih varijabli X i Y naziva se dvodimenzionalna slučajna varijabla ili slučajni vektor dvodimenzionalnog prostora. Dvodimenzionalna slučajna varijabla (X,Y) također se naziva sustavom slučajnih varijabli X i Y. Skup svih mogućih vrijednosti diskretne slučajne varijable s njihovim vjerojatnostima naziva se zakon distribucije ove slučajne varijable. Diskretna dvodimenzionalna slučajna varijabla (X, Y) smatra se danom ako je poznat njen zakon distribucije:

P(X=x i , Y=y j) = p ij , i=1,2...,n, j=1,2...,m

Zadatak usluge. Korištenjem usluge, prema datom zakonu o distribuciji, možete pronaći:

  • distribucijski nizovi X i Y, matematičko očekivanje M[X], M[Y], varijanca D[X], D[Y];
  • kovarijansa cov(x,y), koeficijent korelacije r x,y , niz uvjetne distribucije X, uvjetno očekivanje M;
Osim toga, daje se odgovor na pitanje: "Jesu li slučajne varijable X i Y ovisne?".

Uputa. Odredite dimenziju matrice distribucije vjerojatnosti (broj redaka i stupaca) i njen oblik. Dobiveno rješenje sprema se u Word datoteku.

Primjer #1. Dvodimenzionalna diskretna slučajna varijabla ima tablicu distribucije:

Y/X 1 2 3 4
10 0 0,11 0,12 0,03
20 0 0,13 0,09 0,02
30 0,02 0,11 0,08 0,01
40 0,03 0,11 0,05 q
Pronađite vrijednost q i koeficijent korelacije ove slučajne varijable.

Odluka. Vrijednost q nalazimo iz uvjeta Σp ij = 1
Σp ij = 0,02 + 0,03 + 0,11 + … + 0,03 + 0,02 + 0,01 + q = 1
0,91+q = 1. Odakle je q = 0,09

Koristeći formulu ∑P(x i,y j) = str i(j=1..n), pronađite red raspodjele X.

matematičko očekivanje M[Y].
M[y] = 1*0,05 + 2*0,46 + 3*0,34 + 4*0,15 = 2,59
disperzija D[Y] = 1 2 *0.05 + 2 2 *0.46 + 3 2 *0.34 + 4 2 *0.15 - 2.59 2 = 0.64
Standardna devijacijaσ(y) = sqrt(D[Y]) = sqrt(0,64) = 0,801

kovarijanca cov(X,Y) = M - M[X] M[Y] = 2 10 0,11 + 3 10 0,12 + 4 10 0,03 + 2 20 0,13 + 3 20 0,09 + 4 20 0,02 + 1 30 0,02 + 0. 3 30 0,08 + 4 30 0,01 + 1 40 0,03 + 2 40 0,11 + 3 40 0,05 + 4 40 0,09 - 25,2 2,59 = -0,068
Koeficijent korelacije rxy = cov(x,y)/σ(x)&sigma(y) = -0,068/(11,531*0,801) = -0,00736

Primjer 2 . Podaci statističke obrade informacija za dva pokazatelja X i Y prikazani su u korelacijskoj tablici. Potreban:

  1. napisati redove distribucije za X i Y i izračunati srednje vrijednosti uzorka i standardne devijacije uzorka za njih;
  2. napisati niz uvjetne distribucije Y/x i izračunati uvjetne prosjeke Y/x;
  3. grafički prikazati ovisnost uvjetnih prosjeka Y/x o vrijednostima X;
  4. izračunati koeficijent korelacije uzorka Y na X;
  5. napisati uzorak jednadžbe izravne regresije;
  6. geometrijski predstaviti podatke korelacijske tablice i izgraditi regresijsku liniju.
Odluka. Uređeni par (X,Y) slučajnih varijabli X i Y naziva se dvodimenzionalna slučajna varijabla ili slučajni vektor dvodimenzionalnog prostora. Dvodimenzionalna slučajna varijabla (X,Y) također se naziva sustavom slučajnih varijabli X i Y.
Skup svih mogućih vrijednosti diskretne slučajne varijable s njihovim vjerojatnostima naziva se zakon distribucije ove slučajne varijable.
Diskretna dvodimenzionalna slučajna varijabla (X,Y) smatra se danom ako je poznat njen zakon distribucije:
P(X=x i , Y=y j) = p ij , i=1,2...,n, j=1,2...,m
X/Y20 30 40 50 60
11 2 0 0 0 0
16 4 6 0 0 0
21 0 3 6 2 0
26 0 0 45 8 4
31 0 0 4 6 7
36 0 0 0 0 3
Događaji (X=x i , Y=y j) čine kompletnu grupu događaja, pa je zbroj svih vjerojatnosti p ij ( i=1,2...,n, j=1,2...,m) naveden u tablici jednak je 1.
1. Ovisnost slučajnih varijabli X i Y.
Pronađite nizove distribucije X i Y.
Koristeći formulu ∑P(x i,y j) = str i(j=1..n), pronađite red raspodjele X. matematičko očekivanje M[Y].
M[y] = (20*6 + 30*9 + 40*55 + 50*16 + 60*14)/100 = 42,3
disperzija D[Y].
D[Y] = (20 2 *6 + 30 2 *9 + 40 2 *55 + 50 2 *16 + 60 2 *14)/100 - 42,3 2 = 99,71
Standardna devijacija σ(y).

Budući da je P(X=11,Y=20) = 2≠2 6, onda su slučajne varijable X i Y ovisni.
2. Zakon uvjetne raspodjele X.
Zakon uvjetne distribucije X(Y=20).
P(X=11/Y=20) = 2/6 = 0,33
P(X=16/Y=20) = 4/6 = 0,67
P(X=21/Y=20) = 0/6 = 0
P(X=26/Y=20) = 0/6 = 0
P(X=31/Y=20) = 0/6 = 0
P(X=36/Y=20) = 0/6 = 0
Uvjetno očekivanje M = 11*0,33 + 16*0,67 + 21*0 + 26*0 + 31*0 + 36*0 = 14,33
Uvjetna varijanca D = 11 2 *0,33 + 16 2 *0,67 + 21 2 *0 + 26 2 *0 + 31 2 *0 + 36 2 *0 - 14,33 2 = 5,56
Zakon uvjetne distribucije X(Y=30).
P(X=11/Y=30) = 0/9 = 0
P(X=16/Y=30) = 6/9 = 0,67
P(X=21/Y=30) = 3/9 = 0,33
P(X=26/Y=30) = 0/9 = 0
P(X=31/Y=30) = 0/9 = 0
P(X=36/Y=30) = 0/9 = 0
Uvjetno očekivanje M = 11*0 + 16*0,67 + 21*0,33 + 26*0 + 31*0 + 36*0 = 17,67
Uvjetna varijanca D = 11 2 *0 + 16 2 *0,67 + 21 2 *0,33 + 26 2 *0 + 31 2 *0 + 36 2 *0 - 17,67 2 = 5,56
Zakon uvjetne distribucije X(Y=40).
P(X=11/Y=40) = 0/55 = 0
P(X=16/Y=40) = 0/55 = 0
P(X=21/Y=40) = 6/55 = 0,11
P(X=26/Y=40) = 45/55 = 0,82
P(X=31/Y=40) = 4/55 = 0,0727
P(X=36/Y=40) = 0/55 = 0
Uvjetno očekivanje M = 11*0 + 16*0 + 21*0,11 + 26*0,82 + 31*0,0727 + 36*0 = 25,82
Uvjetna varijanca D = 11 2 *0 + 16 2 *0 + 21 2 *0,11 + 26 2 *0,82 + 31 2 *0,0727 + 36 2 *0 - 25,82 2 = 4,51
Zakon uvjetne distribucije X(Y=50).
P(X=11/Y=50) = 0/16 = 0
P(X=16/Y=50) = 0/16 = 0
P(X=21/Y=50) = 2/16 = 0,13
P(X=26/Y=50) = 8/16 = 0,5
P(X=31/Y=50) = 6/16 = 0,38
P(X=36/Y=50) = 0/16 = 0
Uvjetno očekivanje M = 11*0 + 16*0 + 21*0,13 + 26*0,5 + 31*0,38 + 36*0 = 27,25
Uvjetna varijanca D = 11 2 *0 + 16 2 *0 + 21 2 *0,13 + 26 2 *0,5 + 31 2 *0,38 + 36 2 *0 - 27,25 2 = 10,94
Zakon uvjetne distribucije X(Y=60).
P(X=11/Y=60) = 0/14 = 0
P(X=16/Y=60) = 0/14 = 0
P(X=21/Y=60) = 0/14 = 0
P(X=26/Y=60) = 4/14 = 0,29
P(X=31/Y=60) = 7/14 = 0,5
P(X=36/Y=60) = 3/14 = 0,21
Uvjetno očekivanje M = 11*0 + 16*0 + 21*0 + 26*0,29 + 31*0,5 + 36*0,21 = 30,64
Uvjetna varijanca D = 11 2 *0 + 16 2 *0 + 21 2 *0 + 26 2 *0,29 + 31 2 *0,5 + 36 2 *0,21 - 30,64 2 = 12,37
3. Zakon uvjetne raspodjele Y.
Zakon uvjetne distribucije Y(X=11).
P(Y=20/X=11) = 2/2 = 1
P(Y=30/X=11) = 0/2 = 0
P(Y=40/X=11) = 0/2 = 0
P(Y=50/X=11) = 0/2 = 0
P(Y=60/X=11) = 0/2 = 0
Uvjetno očekivanje M = 20*1 + 30*0 + 40*0 + 50*0 + 60*0 = 20
Uvjetna varijanca D = 20 2 *1 + 30 2 *0 + 40 2 *0 + 50 2 *0 + 60 2 *0 - 20 2 = 0
Zakon uvjetne distribucije Y(X=16).
P(Y=20/X=16) = 4/10 = 0,4
P(Y=30/X=16) = 6/10 = 0,6
P(Y=40/X=16) = 0/10 = 0
P(Y=50/X=16) = 0/10 = 0
P(Y=60/X=16) = 0/10 = 0
Uvjetno očekivanje M = 20*0,4 + 30*0,6 + 40*0 + 50*0 + 60*0 = 26
Uvjetna varijanca D = 20 2 *0,4 + 30 2 *0,6 + 40 2 *0 + 50 2 *0 + 60 2 *0 - 26 2 = 24
Zakon uvjetne distribucije Y(X=21).
P(Y=20/X=21) = 0/11 = 0
P(Y=30/X=21) = 3/11 = 0,27
P(Y=40/X=21) = 6/11 = 0,55
P(Y=50/X=21) = 2/11 = 0,18
P(Y=60/X=21) = 0/11 = 0
Uvjetno očekivanje M = 20*0 + 30*0,27 + 40*0,55 + 50*0,18 + 60*0 = 39,09
Uvjetna varijanca D = 20 2 *0 + 30 2 *0,27 + 40 2 *0,55 + 50 2 *0,18 + 60 2 *0 - 39,09 2 = 44,63
Zakon uvjetne distribucije Y(X=26).
P(Y=20/X=26) = 0/57 = 0
P(Y=30/X=26) = 0/57 = 0
P(Y=40/X=26) = 45/57 = 0,79
P(Y=50/X=26) = 8/57 = 0,14
P(Y=60/X=26) = 4/57 = 0,0702
Uvjetno očekivanje M = 20*0 + 30*0 + 40*0,79 + 50*0,14 + 60*0,0702 = 42,81
Uvjetna varijanca D = 20 2 *0 + 30 2 *0 + 40 2 *0,79 + 50 2 *0,14 + 60 2 *0,0702 - 42,81 2 = 34,23
Zakon uvjetne distribucije Y(X=31).
P(Y=20/X=31) = 0/17 = 0
P(Y=30/X=31) = 0/17 = 0
P(Y=40/X=31) = 4/17 = 0,24
P(Y=50/X=31) = 6/17 = 0,35
P(Y=60/X=31) = 7/17 = 0,41
Uvjetno očekivanje M = 20*0 + 30*0 + 40*0,24 + 50*0,35 + 60*0,41 = 51,76
Uvjetna varijanca D = 20 2 *0 + 30 2 *0 + 40 2 *0,24 + 50 2 *0,35 + 60 2 *0,41 - 51,76 2 = 61,59
Zakon uvjetne distribucije Y(X=36).
P(Y=20/X=36) = 0/3 = 0
P(Y=30/X=36) = 0/3 = 0
P(Y=40/X=36) = 0/3 = 0
P(Y=50/X=36) = 0/3 = 0
P(Y=60/X=36) = 3/3 = 1
Uvjetno očekivanje M = 20*0 + 30*0 + 40*0 + 50*0 + 60*1 = 60
Uvjetna varijanca D = 20 2 *0 + 30 2 *0 + 40 2 *0 + 50 2 *0 + 60 2 *1 - 60 2 = 0
kovarijanca.
cov(X,Y) = M - M[X] M[Y]
cov(X,Y) = (20 11 2 + 20 16 4 + 30 16 6 + 30 21 3 + 40 21 6 + 50 21 2 + 40 26 45 + 50 26 8 + 60 26 4 + 40 50 3 6 + 60 31 7 + 60 36 3)/100 - 25,3 42,3 = 38,11
Ako su slučajne varijable neovisne, onda je njihova kovarijansa nula. U našem slučaju cov(X,Y) ≠ 0.
Koeficijent korelacije.


Jednadžba linearne regresije od y do x je:

Jednadžba linearne regresije od x do y je:

Pronađite potrebne numeričke karakteristike.
Uzorak znači:
x = (20(2 + 4) + 30(6 + 3) + 40(6 + 45 + 4) + 50(2 + 8 + 6) + 60(4 + 7 + 3))/100 = 42,3
y = (20(2 + 4) + 30(6 + 3) + 40(6 + 45 + 4) + 50(2 + 8 + 6) + 60(4 + 7 + 3))/100 = 25,3
disperzije:
σ 2 x = (20 2 (2 + 4) + 30 2 (6 + 3) + 40 2 (6 + 45 + 4) + 50 2 (2 + 8 + 6) + 60 2 (4 + 7 + 3)) )/100 - 42,3 2 = 99,71
σ 2 y = (11 2 (2) + 16 2 (4 + 6) + 21 2 (3 + 6 + 2) + 26 2 (45 + 8 + 4) + 31 2 (4 + 6 + 7) + 36) 2 (3))/100 - 25,3 2 = 24,01
Gdje dobivamo standardne devijacije:
σ x = 9,99 i σ y = 4,9
i kovarijansa:
Cov(x,y) = (20 11 2 + 20 16 4 + 30 16 6 + 30 21 3 + 40 21 6 + 50 21 2 + 40 26 45 + 50 26 8 + 60 26 4 + 40 50 3 6 + 60 31 7 + 60 36 3)/100 - 42,3 25,3 = 38,11
Definirajmo koeficijent korelacije:


Zapišimo jednadžbe regresijskih linija y(x):

a računajući, dobivamo:
yx = 0,38x + 9,14
Zapišimo jednadžbe regresijskih linija x(y):

a računajući, dobivamo:
x y = 1,59 y + 2,15
Ako izgradimo točke definirane tablicom i regresijskim linijama, vidjet ćemo da obje linije prolaze kroz točku s koordinatama (42.3; 25.3), a točke se nalaze blizu regresijskih linija.
Značaj koeficijenta korelacije.

Prema Studentovoj tablici s razinom značajnosti α=0,05 i stupnjevima slobode k=100-m-1 = 98 nalazimo t crit:
t crit (n-m-1;α/2) = (98;0,025) = 1,984
gdje je m = 1 broj eksplanatornih varijabli.
Ako je t obs > t kritično, tada se dobivena vrijednost koeficijenta korelacije prepoznaje kao značajna (odbacuje se nulta hipoteza koja tvrdi da je koeficijent korelacije jednak nuli).
Budući da je t obl > t crit, odbacujemo hipotezu da je koeficijent korelacije jednak 0. Drugim riječima, koeficijent korelacije je statistički značajan.

Vježbajte. Broj pogodaka parova vrijednosti slučajnih varijabli X i Y u odgovarajućim intervalima dat je u tablici. Iz ovih podataka pronađite koeficijent korelacije uzorka i jednadžbe uzorka ravnih regresijskih linija Y na X i X na Y .
Odluka

Primjer. Raspodjela vjerojatnosti dvodimenzionalne slučajne varijable (X, Y) dana je tablicom. Naći zakone raspodjele komponentnih veličina X, Y i koeficijent korelacije p(X, Y).
Preuzmite Rješenje

Vježbajte. Dvodimenzionalna diskretna vrijednost (X, Y) dana je zakonom raspodjele. Naći zakone raspodjele X i Y komponenti, kovarijaciju i koeficijent korelacije.

Definicija 2.7. je par slučajnih brojeva (X, Y), ili točka na koordinatnoj ravnini (slika 2.11).

Riža. 2.11.

Dvodimenzionalna slučajna varijabla je poseban slučaj višedimenzionalne slučajne varijable ili slučajnog vektora.

Definicija 2.8. Slučajni vektor - je li to slučajna funkcija?,(/) s konačnim skupom mogućih vrijednosti argumenata t,čija vrijednost za bilo koju vrijednost t je slučajna varijabla.

Dvodimenzionalna slučajna varijabla naziva se kontinuirana ako su njezine koordinate kontinuirane, a diskretna ako su njene koordinate diskretne.

Postaviti zakon raspodjele dvodimenzionalnih slučajnih varijabli znači uspostaviti korespondenciju između njegovih mogućih vrijednosti i vjerojatnosti tih vrijednosti. Prema načinu postavljanja, slučajne varijable se dijele na kontinuirane i diskretne, iako postoje opći načini za postavljanje zakona distribucije bilo kojeg RV-a.

Diskretna dvodimenzionalna slučajna varijabla

Diskretna dvodimenzionalna slučajna varijabla specificira se pomoću distribucijske tablice (Tablica 2.1).

Tablica 2.1

Tablica raspodjele (zajednička raspodjela) CB ( x, U)

Elementi tablice definirani su formulom

Svojstva elementa tablice distribucije:

Raspodjela po svakoj koordinatnoj se zove jednodimenzionalni ili marginalno:

R 1> = P(X =.d,) - marginalna raspodjela SW x;

p^2) = P(Y= y,)- marginalna distribucija SV U.

Komunikacija zajedničke distribucije CB x i Y, dano skupom vjerojatnosti [p () ), i = 1,..., n,j = 1,..., t(tablica raspodjele), te marginalna distribucija.


Slično za SV U p- 2)= X p, g

Problem 2.14. dano:

Kontinuirana 2D slučajna varijabla

/(X, y)dxdy- element vjerojatnosti za dvodimenzionalnu slučajnu varijablu (X, Y) - vjerojatnost pogađanja slučajne varijable (X, Y) u pravokutniku sa stranicama cbc, dy na dx, dy -* 0:

f(x, y) - gustoća raspodjele dvodimenzionalna slučajna varijabla (X, Y). Zadatak /(x, y) dajemo potpunu informaciju o raspodjeli dvodimenzionalne slučajne varijable.

Granične distribucije specificiraju se na sljedeći način: za X - gustoćom distribucije CB X/,(x); na Y- Gustoća distribucije SV f>(y).

Postavljanje zakona distribucije dvodimenzionalne slučajne varijable pomoću funkcije distribucije

Univerzalni način određivanja zakona distribucije za diskretnu ili kontinuiranu dvodimenzionalnu slučajnu varijablu je funkcija distribucije F(x, y).

Definicija 2.9. Funkcija distribucije F(x, y)- vjerojatnost zajedničkog nastupa događaja (Xy), t.j. F(x0,y n) = = P(X y), bačen na koordinatnu ravninu, pada u beskonačan kvadrant s vrhom u točki M(x 0, u i)(u zasjenjenom području na slici 2.12).

Riža. 2.12. Ilustracija funkcije distribucije F( x, y)

Svojstva funkcije F(x, y)

  • 1) 0 1;
  • 2) F(-oo,-oo) = F(x,-oo) = F(-oo, y) = 0; F( oo, oo) = 1;
  • 3) F(x, y)- neopadajući u svakom argumentu;
  • 4) F(x, y) - kontinuirano lijevo i dolje;
  • 5) konzistentnost distribucija:

F(x, X: F(x, oo) = F,(x); F(y, oo) - marginalna raspodjela preko Y F( oo, y) = F 2 (y). Povezivanje /(x, y) s F(x, y):

Odnos između gustoće zglobova i granične gustoće. Dana f(x, y). Dobivamo granične gustoće raspodjele f(x),f 2 (y)".


Slučaj neovisnih koordinata dvodimenzionalne slučajne varijable

Definicija 2.10. SW x i Yindependent(nc) ako su neki događaji povezani sa svakim od ovih RV-ova neovisni. Iz definicije nc CB slijedi:

  • 1 )Pij = p X) pf
  • 2 )F(x,y) = F l (x)F 2 (y).

Ispada da za neovisne SW x i Y dovršeno i

3 )f(x,y) = J(x)f,(y).

Dokažimo to za nezavisne SW x i Y2) 3). Dokaz, a) Neka 2), tj.

u isto vrijeme F(x,y) = f J f(u,v)dudv, odakle slijedi 3);

b) neka 3 sada drži, dakle


oni. istina 2).

Razmotrimo zadatke.

Problem 2.15. Distribucija je data sljedećom tablicom:

Gradimo marginalne distribucije:

dobivamo P(X = 3, U = 4) = 0,17 * P(X = 3) P (Y = 4) \u003d 0,1485 => => SV x i uzdržavane osobe.

Funkcija distribucije:


Problem 2.16. Distribucija je data sljedećom tablicom:

dobivamo P tl = 0,2 0,3 = 0,06; P 12 \u003d 0,2? 0,7 = 0,14; P2l = 0,8 ? 0,3 = = 0,24; R 22 - 0,8 0,7 = 0,56 => SW x i Y nz.

Problem 2.17. Dana /(x, y) = 1/st exp| -0,5 (d "+ 2xy + 5d/ 2)]. Pronaći Oh) i /Ay)-

Odluka

(izračunajte sami).