Casuale bidimensionale. Variabile casuale 2D

Una coppia ordinata (X , Y) di variabili casuali X e Y è chiamata variabile casuale bidimensionale o vettore casuale di uno spazio bidimensionale. Una variabile casuale bidimensionale (X,Y) è anche chiamata sistema di variabili casuali X e Y. L'insieme di tutti i possibili valori di una variabile casuale discreta con le loro probabilità è chiamato legge di distribuzione di questa variabile casuale. Una variabile casuale bidimensionale discreta (X, Y) è considerata data se è nota la sua legge di distribuzione:

P(X=x io , Y=y j) = p ij , i=1,2...,n, j=1,2...,m

Incarico di servizio. Utilizzando il servizio, secondo una determinata legge di distribuzione, puoi trovare:

  • serie di distribuzione X e Y, aspettativa matematica M[X], M[Y], varianza D[X], D[Y];
  • covarianza cov(x,y), coefficiente di correlazione r x,y , serie di distribuzione condizionale X, aspettativa condizionale M;
Inoltre, viene data una risposta alla domanda "Le variabili casuali X e Y dipendono?".

Istruzione. Specificare la dimensione della matrice di distribuzione di probabilità (numero di righe e colonne) e la sua forma. La soluzione risultante viene salvata in un file Word.

Esempio 1. Una variabile casuale discreta bidimensionale ha una tabella di distribuzione:

Y/X 1 2 3 4
10 0 0,11 0,12 0,03
20 0 0,13 0,09 0,02
30 0,02 0,11 0,08 0,01
40 0,03 0,11 0,05 q
Trova il valore q e il coefficiente di correlazione di questa variabile casuale.

Decisione. Troviamo il valore q dalla condizione Σp ij = 1
Σp ij = 0,02 + 0,03 + 0,11 + … + 0,03 + 0,02 + 0,01 + q = 1
0,91+q = 1. Da cui q = 0,09

Utilizzando la formula ∑P(x io,y j) = pag io(j=1..n), trova la serie di distribuzione X.

Aspettativa matematica M[Y].
M[y] = 1*0,05 + 2*0,46 + 3*0,34 + 4*0,15 = 2,59
Dispersione D[Y] = 1 2 *0.05 + 2 2 *0.46 + 3 2 *0.34 + 4 2 *0.15 - 2.59 2 = 0.64
Deviazione standardσ(y) = sqrt(D[Y]) = sqrt(0,64) = 0,801

covarianza cov(X,Y) = M - M[X] M[Y] = 2 10 0.11 + 3 10 0.12 + 4 10 0.03 + 2 20 0.13 + 3 20 0.09 + 4 20 0.02 + 1 30 0.02 + 2 30 0.11 + 3 30 0,08 + 4 30 0,01 + 1 40 0,03 + 2 40 0,11 + 3 40 0,05 + 4 40 0,09 - 25,2 2,59 = -0,068
Coefficiente di correlazione rxy = cov(x,y)/σ(x)&sigma(y) = -0,068/(11,531*0,801) = -0,00736

Esempio 2. I dati dell'elaborazione statistica delle informazioni relative ai due indicatori X e Y sono riflessi nella tavola di correlazione. Necessario:

  1. scrivere le serie di distribuzione per X e Y e calcolare le medie campionarie e le deviazioni standard campionarie per esse;
  2. scrivi la serie di distribuzioni condizionali Y/x e calcola le medie condizionali Y/x;
  3. rappresentare graficamente la dipendenza delle medie condizionali Y/x dai valori di X;
  4. calcolare il coefficiente di correlazione campionaria Y su X;
  5. scrivere un'equazione di regressione diretta campionaria;
  6. rappresentare geometricamente i dati della tabella di correlazione e costruire una retta di regressione.
Decisione. Una coppia ordinata (X,Y) di variabili casuali X e Y è chiamata variabile casuale bidimensionale o vettore casuale di uno spazio bidimensionale. Una variabile casuale bidimensionale (X,Y) è anche chiamata sistema di variabili casuali X e Y.
L'insieme di tutti i possibili valori di una variabile casuale discreta con le loro probabilità è chiamato legge di distribuzione di questa variabile casuale.
Una variabile casuale bidimensionale discreta (X,Y) è considerata data se è nota la sua legge di distribuzione:
P(X=x io , Y=y j) = p ij , i=1,2...,n, j=1,2...,m
X/Y20 30 40 50 60
11 2 0 0 0 0
16 4 6 0 0 0
21 0 3 6 2 0
26 0 0 45 8 4
31 0 0 4 6 7
36 0 0 0 0 3
Gli eventi (X=x i , Y=y j) formano un gruppo completo di eventi, quindi la somma di tutte le probabilità p ij ( i=1,2...,n, j=1,2...,m) indicato nella tabella è uguale a 1.
1. Dipendenza di variabili casuali X e Y.
Trova le serie di distribuzione X e Y.
Utilizzando la formula ∑P(x io,y j) = pag io(j=1..n), trova la serie di distribuzione X. Aspettativa matematica M[Y].
M[y] = (20*6 + 30*9 + 40*55 + 50*16 + 60*14)/100 = 42,3
Dispersione D[Y].
G[Y] = (20 2 *6 + 30 2 *9 + 40 2 *55 + 50 2 *16 + 60 2 *14)/100 - 42,3 2 = 99,71
Deviazione standard σ(y).

Poiché, P(X=11,Y=20) = 2≠2 6, allora le variabili casuali X e Y dipendente.
2. Diritto di distribuzione condizionale X.
Legge di distribuzione condizionata X(Y=20).
P(X=11/Y=20) = 2/6 = 0,33
P(X=16/Y=20) = 4/6 = 0,67
P(X=21/Y=20) = 0/6 = 0
P(X=26/Y=20) = 0/6 = 0
P(X=31/Y=20) = 0/6 = 0
P(X=36/Y=20) = 0/6 = 0
Aspettativa condizionale M = 11*0,33 + 16*0,67 + 21*0 + 26*0 + 31*0 + 36*0 = 14,33
Varianza condizionale D = 11 2 *0,33 + 16 2 *0,67 + 21 2 *0 + 26 2 *0 + 31 2 *0 + 36 2 *0 - 14,33 2 = 5,56
Legge di distribuzione condizionata X(Y=30).
P(X=11/Y=30) = 0/9 = 0
P(X=16/Y=30) = 6/9 = 0,67
P(X=21/Y=30) = 3/9 = 0,33
P(X=26/Y=30) = 0/9 = 0
P(X=31/Y=30) = 0/9 = 0
P(X=36/Y=30) = 0/9 = 0
Aspettativa condizionale M = 11*0 + 16*0,67 + 21*0,33 + 26*0 + 31*0 + 36*0 = 17,67
Varianza condizionale D = 11 2 *0 + 16 2 *0,67 + 21 2 *0,33 + 26 2 *0 + 31 2 *0 + 36 2 *0 - 17,67 2 = 5,56
Legge di distribuzione condizionata X(Y=40).
P(X=11/Y=40) = 0/55 = 0
P(X=16/Y=40) = 0/55 = 0
P(X=21/Y=40) = 6/55 = 0,11
P(X=26/Y=40) = 45/55 = 0,82
P(X=31/Y=40) = 4/55 = 0,0727
P(X=36/Y=40) = 0/55 = 0
Aspettativa condizionale M = 11*0 + 16*0 + 21*0,11 + 26*0,82 + 31*0,0727 + 36*0 = 25,82
Varianza condizionale D = 11 2 *0 + 16 2 *0 + 21 2 *0,11 + 26 2 *0,82 + 31 2 *0,0727 + 36 2 *0 - 25,82 2 = 4,51
Legge di distribuzione condizionata X(Y=50).
P(X=11/Y=50) = 0/16 = 0
P(X=16/Y=50) = 0/16 = 0
P(X=21/Y=50) = 2/16 = 0,13
P(X=26/Y=50) = 8/16 = 0,5
P(X=31/Y=50) = 6/16 = 0,38
P(X=36/Y=50) = 0/16 = 0
Aspettativa condizionale M = 11*0 + 16*0 + 21*0,13 + 26*0,5 + 31*0,38 + 36*0 = 27,25
Varianza condizionale D = 11 2 *0 + 16 2 *0 + 21 2 *0,13 + 26 2 *0,5 + 31 2 *0,38 + 36 2 *0 - 27,25 2 = 10,94
Legge di distribuzione condizionata X(Y=60).
P(X=11/Y=60) = 0/14 = 0
P(X=16/Y=60) = 0/14 = 0
P(X=21/Y=60) = 0/14 = 0
P(X=26/Y=60) = 4/14 = 0,29
P(X=31/Y=60) = 7/14 = 0,5
P(X=36/Y=60) = 3/14 = 0,21
Aspettativa condizionale M = 11*0 + 16*0 + 21*0 + 26*0,29 + 31*0,5 + 36*0,21 = 30,64
Varianza condizionale D = 11 2 *0 + 16 2 *0 + 21 2 *0 + 26 2 *0,29 + 31 2 *0,5 + 36 2 *0,21 - 30,64 2 = 12,37
3. Diritto di distribuzione condizionale Y.
Legge di distribuzione condizionata Y(X=11).
P(Y=20/X=11) = 2/2 = 1
P(Y=30/X=11) = 0/2 = 0
P(Y=40/X=11) = 0/2 = 0
P(Y=50/X=11) = 0/2 = 0
P(Y=60/X=11) = 0/2 = 0
Aspettativa condizionale M = 20*1 + 30*0 + 40*0 + 50*0 + 60*0 = 20
Varianza condizionale D = 20 2 *1 + 30 2 *0 + 40 2 *0 + 50 2 *0 + 60 2 *0 - 20 2 = 0
Legge di distribuzione condizionata Y(X=16).
P(Y=20/X=16) = 4/10 = 0,4
P(Y=30/X=16) = 6/10 = 0,6
P(Y=40/X=16) = 0/10 = 0
P(Y=50/X=16) = 0/10 = 0
P(Y=60/X=16) = 0/10 = 0
Aspettativa condizionale M = 20*0,4 + 30*0,6 + 40*0 + 50*0 + 60*0 = 26
Varianza condizionale D = 20 2 *0,4 + 30 2 *0,6 + 40 2 *0 + 50 2 *0 + 60 2 *0 - 26 2 = 24
Legge di distribuzione condizionata Y(X=21).
P(Y=20/X=21) = 0/11 = 0
P(Y=30/X=21) = 3/11 = 0,27
P(Y=40/X=21) = 6/11 = 0,55
P(Y=50/X=21) = 2/11 = 0,18
P(Y=60/X=21) = 0/11 = 0
Aspettativa condizionale M = 20*0 + 30*0,27 + 40*0,55 + 50*0,18 + 60*0 = 39,09
Varianza condizionale D = 20 2 *0 + 30 2 *0,27 + 40 2 *0,55 + 50 2 *0,18 + 60 2 *0 - 39,09 2 = 44,63
Legge di distribuzione condizionata Y(X=26).
P(Y=20/X=26) = 0/57 = 0
P(Y=30/X=26) = 0/57 = 0
P(Y=40/X=26) = 45/57 = 0,79
P(Y=50/X=26) = 8/57 = 0,14
P(Y=60/X=26) = 4/57 = 0,0702
Aspettativa condizionale M = 20*0 + 30*0 + 40*0,79 + 50*0,14 + 60*0,0702 = 42,81
Varianza condizionale D = 20 2 *0 + 30 2 *0 + 40 2 *0,79 + 50 2 *0,14 + 60 2 *0,0702 - 42,81 2 = 34,23
Legge di distribuzione condizionale Y(X=31).
P(Y=20/X=31) = 0/17 = 0
P(Y=30/X=31) = 0/17 = 0
P(Y=40/X=31) = 4/17 = 0,24
P(Y=50/X=31) = 6/17 = 0,35
P(Y=60/X=31) = 7/17 = 0,41
Aspettativa condizionale M = 20*0 + 30*0 + 40*0,24 + 50*0,35 + 60*0,41 = 51,76
Varianza condizionale D = 20 2 *0 + 30 2 *0 + 40 2 *0,24 + 50 2 *0,35 + 60 2 *0,41 - 51,76 2 = 61,59
Legge di distribuzione condizionale Y(X=36).
P(Y=20/X=36) = 0/3 = 0
P(Y=30/X=36) = 0/3 = 0
P(Y=40/X=36) = 0/3 = 0
P(Y=50/X=36) = 0/3 = 0
P(Y=60/X=36) = 3/3 = 1
Aspettativa condizionale M = 20*0 + 30*0 + 40*0 + 50*0 + 60*1 = 60
Varianza condizionale D = 20 2 *0 + 30 2 *0 + 40 2 *0 + 50 2 *0 + 60 2 *1 - 60 2 = 0
covarianza.
cov(X,Y) = M - M[X] M[Y]
cov(X,Y) = (20 11 2 + 20 16 4 + 30 16 6 + 30 21 3 + 40 21 6 + 50 21 2 + 40 26 45 + 50 26 8 + 60 26 4 + 40 31 4 + 50 31 6 + 60 31 7 + 60 36 3)/100 - 25,3 42,3 = 38,11
Se le variabili casuali sono indipendenti, la loro covarianza è zero. Nel nostro caso cov(X,Y) ≠ 0.
Coefficiente di correlazione.


L'equazione di regressione lineare da y a x è:

L'equazione di regressione lineare da x a y è:

Trova le caratteristiche numeriche necessarie.
Campione significa:
x = (20(2 + 4) + 30(6 + 3) + 40(6 + 45 + 4) + 50(2 + 8 + 6) + 60(4 + 7 + 3))/100 = 42,3
y = (20(2 + 4) + 30(6 + 3) + 40(6 + 45 + 4) + 50(2 + 8 + 6) + 60(4 + 7 + 3))/100 = 25,3
dispersioni:
σ 2 x = (20 2 (2 + 4) + 30 2 (6 + 3) + 40 2 (6 + 45 + 4) + 50 2 (2 + 8 + 6) + 60 2 (4 + 7 + 3) )/100 - 42,3 2 = 99,71
σ 2 y = (11 2 (2) + 16 2 (4 + 6) + 21 2 (3 + 6 + 2) + 26 2 (45 + 8 + 4) + 31 2 (4 + 6 + 7) + 36 2 (3))/100 - 25,3 2 = 24,01
Dove otteniamo le deviazioni standard:
σ x = 9,99 e σ y = 4,9
e covarianza:
Cov(x,y) = (20 11 2 + 20 16 4 + 30 16 6 + 30 21 3 + 40 21 6 + 50 21 2 + 40 26 45 + 50 26 8 + 60 26 4 + 40 31 4 + 50 31 6 + 60 31 7 + 60 36 3)/100 - 42,3 25,3 = 38,11
Definiamo il coefficiente di correlazione:


Scriviamo le equazioni delle rette di regressione y(x):

e calcolando, otteniamo:
yx = 0,38x + 9,14
Scriviamo le equazioni delle rette di regressione x(y):

e calcolando, otteniamo:
x y = 1,59 y + 2,15
Se costruiamo i punti definiti dalla tabella e le rette di regressione, vedremo che entrambe le rette passano per il punto con le coordinate (42.3; 25.3) ei punti si trovano vicino alle rette di regressione.
Significato del coefficiente di correlazione.

Secondo la tabella di Student con livello di significatività α=0.05 e gradi di libertà k=100-m-1 = 98 troviamo t crit:
t critico (n-m-1;α/2) = (98;0,025) = 1,984
dove m = 1 è il numero di variabili esplicative.
Se t obs > t è critico, allora il valore ottenuto del coefficiente di correlazione viene riconosciuto come significativo (si rifiuta l'ipotesi nulla che affermi che il coefficiente di correlazione sia uguale a zero).
Poiché t obl > t crit, respingiamo l'ipotesi che il coefficiente di correlazione sia uguale a 0. In altre parole, il coefficiente di correlazione è statisticamente significativo.

Esercizio. Nella tabella è riportato il numero di colpi di coppie di valori delle variabili casuali X e Y negli intervalli corrispondenti. Da questi dati, trovare il coefficiente di correlazione campionaria e le equazioni campionarie delle rette di regressione Y su X e X su Y .
Decisione

Esempio. La distribuzione di probabilità di una variabile casuale bidimensionale (X, Y) è data da una tabella. Trova le leggi di distribuzione delle grandezze componenti X, Y e il coefficiente di correlazione p(X, Y).
Scarica la soluzione

Esercizio. Un valore discreto bidimensionale (X, Y) è dato da una legge di distribuzione. Trova le leggi di distribuzione delle componenti X e Y, la covarianza e il coefficiente di correlazione.

Sia data una variabile casuale bidimensionale $(X,Y)$.

Definizione 1

La legge di distribuzione di una variabile casuale bidimensionale $(X,Y)$ è l'insieme delle possibili coppie di numeri $(x_i,\ y_j)$ (dove $x_i \epsilon X,\ y_j \epsilon Y$) e le loro probabilità $p_(ij)$ .

Molto spesso, la legge di distribuzione di una variabile casuale bidimensionale è scritta sotto forma di tabella (Tabella 1).

Figura 1. Legge di distribuzione di una variabile casuale bidimensionale.

Ricordiamoci ora teorema sulla somma delle probabilità di eventi indipendenti.

Teorema 1

La probabilità della somma di un numero finito di eventi indipendenti $(\ A)_1$, $(\ A)_2$, ... ,$\ (\ A)_n$ è calcolata dalla formula:

Usando questa formula si ottengono leggi di distribuzione per ogni componente di una variabile aleatoria bidimensionale, ovvero:

Da qui ne seguirà che la somma di tutte le probabilità di un sistema bidimensionale ha la seguente forma:

Consideriamo in dettaglio (passo dopo passo) il problema connesso al concetto di legge di distribuzione di una variabile aleatoria bidimensionale.

Esempio 1

La legge di distribuzione di una variabile casuale bidimensionale è data dalla seguente tabella:

Figura 2.

Trova le leggi di distribuzione delle variabili casuali $X,\ Y$, $X+Y$ e controlla in ogni caso che la somma totale delle probabilità sia uguale a uno.

  1. Troviamo prima la distribuzione della variabile casuale $X$. La variabile casuale $X$ può assumere i valori $x_1=2,$ $x_2=3$, $x_3=5$. Per trovare la distribuzione useremo il Teorema 1.

Per prima cosa troviamo la somma delle probabilità $x_1$ come segue:

Figura 3

Allo stesso modo, troviamo $P\left(x_2\right)$ e $P\left(x_3\right)$:

\ \

Figura 4

  1. Troviamo ora la distribuzione della variabile casuale $Y$. La variabile casuale $Y$ può assumere i valori $x_1=1,$ $x_2=3$, $x_3=4$. Per trovare la distribuzione useremo il Teorema 1.

Per prima cosa troviamo la somma delle probabilità $y_1$ come segue:

Figura 5

Allo stesso modo, troviamo $P\left(y_2\right)$ e $P\left(y_3\right)$:

\ \

Quindi, la legge di distribuzione della quantità $X$ ha la seguente forma:

Figura 6

Verifichiamo il soddisfacimento dell'uguaglianza della somma totale delle probabilità:

  1. Resta da trovare la legge di distribuzione della variabile aleatoria $X+Y$.

Designiamolo per comodità con $Z$: $Z=X+Y$.

Per prima cosa, scopriamo quali valori può assumere questa quantità. Per fare ciò, aggiungeremo a coppie i valori di $X$ e $Y$. Otteniamo i seguenti valori: 3, 4, 6, 5, 6, 8, 6, 7, 9. Ora, scartando i valori abbinati, otteniamo che la variabile casuale $X+Y$ può assumere i valori $z_1 =3,\ z_2=4 ,\ z_3=5,\ z_4=6,\ z_5=7,\ z_6=8,\ z_7=9.\ $

Per prima cosa, troviamo $P(z_1)$. Poiché il valore di $z_1$ è singolo, si trova come segue:

Figura 7

Tutte le probabilità si trovano in modo simile, ad eccezione di $P(z_4)$:

Troviamo ora $P(z_4)$ come segue:

Figura 8

Quindi, la legge di distribuzione per $Z$ ha la seguente forma:

Figura 9

Verifichiamo il soddisfacimento dell'uguaglianza della somma totale delle probabilità:

Definizione. Se si danno due variabili casuali sullo stesso spazio degli eventi elementari X e Y, poi dicono che è dato variabile casuale bidimensionale (X,Y) .

Esempio. La macchina stampa piastrelle in acciaio. Lunghezza controllata X e larghezza Y. − SW bidimensionale.

SW X e Y hanno le proprie funzioni di distribuzione e altre caratteristiche.

Definizione. La funzione di distribuzione di una variabile casuale bidimensionale (X, Y) è chiamata funzione.

Definizione. La legge di distribuzione di una variabile casuale bidimensionale discreta (X, Y) chiamato tavolo

Per un SW discreto bidimensionale.

Proprietà :

2) se , allora ; se poi ;

4) − funzione di distribuzione X;

− funzione di distribuzione Y.

Probabilità di colpire i valori del SW bidimensionale nel rettangolo:

Definizione. Variabile casuale 2D (X,Y) chiamata continuo se la sua funzione di distribuzione è continua e ha ovunque (con la possibile eccezione di un numero finito di curve) una derivata parziale continua mista del 2° ordine .

Definizione. La densità della distribuzione di probabilità congiunta del SW bidimensionale continuo è chiamata funzione.

Poi ovviamente .

Esempio 1 Il SW bidimensionale continuo è dato dalla funzione di distribuzione

Allora la densità di distribuzione ha la forma

Esempio 2 Il SW bidimensionale continuo è dato dalla densità di distribuzione

Troviamo la sua funzione di distribuzione:

Proprietà :

3) per qualsiasi area.

Si noti la densità di distribuzione articolare. Quindi la densità di distribuzione di ciascuno dei componenti del SW bidimensionale si trova come segue:

Esempio 2 (continua).

Le densità di distribuzione delle componenti SW bidimensionali sono chiamate da alcuni autori marginale densità di distribuzione di probabilità .

Leggi condizionali di distribuzione dei componenti del sistema di RV discreti.

Probabilità condizionata, dove .

Legge di distribuzione condizionata del componente X A :

X
R

Allo stesso modo per , dove .

Facciamo una legge di distribuzione condizionale X A Y= 2.

Poi la legge della distribuzione condizionale

X -1
R

Definizione. La densità di distribuzione condizionale della componente X ad un dato valore S=s chiamata .

Allo stesso modo: .

Definizione. condizionale matematico in attesa di SW Y discreto at è chiamato , dove − vedi sopra.

Quindi, .

Per continuo SW Y .

Ovviamente è una funzione dell'argomento X. Questa funzione è chiamata funzione di regressione Y su X .

Allo stesso modo definito funzione di regressione x su y : .

Teorema 5. (Sulla funzione di distribuzione di RV indipendenti)

SW X e Y

Conseguenza. SW continuo X e Y sono indipendenti se e solo se .

Nell'esempio 1 con . Pertanto, SW X e Y indipendente.

Caratteristiche numeriche delle componenti di una variabile casuale bidimensionale

Per CB discreto:

Per SW continuo: .

Dispersione e deviazione standard per tutti i SW sono determinati dalle stesse formule a noi note:

Definizione. Il punto è chiamato centro di dispersione SW bidimensionale.

Definizione. Covarianza (momento di correlazione) NE è chiamato

Per SW discreto: .

Per SW continuo: .

Formula per il calcolo: .

Per CB indipendenti.

L'inconveniente della caratteristica è la sua dimensione (il quadrato dell'unità di misura dei componenti). La quantità seguente è esente da questa mancanza.

Definizione. Coefficiente di correlazione SW X e Y chiamata

Per CB indipendenti.

Per qualsiasi coppia di SW . È risaputo che se e solo se , dove .

Definizione. SW X e Y chiamata non correlato , Se .

Relazione tra correlazione e dipendenza di SW:

− se CB X e Y correlato, cioè , allora sono dipendenti; non è vero il contrario;

− se CB X e Y indipendente, quindi ; non è vero il contrario.

Nota 1. Se SW X e Y distribuito a norma di legge e , allora sono indipendenti.

Nota 2. Valore pratico come misura della dipendenza è giustificata solo quando la distribuzione congiunta della coppia è normale o approssimativamente normale. Per SW arbitrario X e Y puoi arrivare a una conclusione errata, ad es. può essere anche quando X e Y associata ad una stretta relazione funzionale.

Osservazione 3. Nella statistica matematica, una correlazione è una dipendenza probabilistica (statistica) tra quantità che, in generale, non hanno un carattere strettamente funzionale. La dipendenza di correlazione si verifica quando una delle quantità dipende non solo dal secondo dato, ma anche da un numero di fattori casuali, oppure quando tra le condizioni da cui dipende l'una o l'altra quantità ci sono condizioni comuni a entrambe.

Esempio 4 Per SW X e Y dall'esempio 3 trova .

Decisione.

Esempio 5 Viene data la densità di distribuzione congiunta del SW bidimensionale.

Una coppia ordinata (X , Y) di variabili casuali X e Y è chiamata variabile casuale bidimensionale o vettore casuale di uno spazio bidimensionale. Una variabile casuale bidimensionale (X,Y) è anche chiamata sistema di variabili casuali X e Y. L'insieme di tutti i possibili valori di una variabile casuale discreta con le loro probabilità è chiamato legge di distribuzione di questa variabile casuale. Una variabile casuale bidimensionale discreta (X, Y) è considerata data se è nota la sua legge di distribuzione:

P(X=x io , Y=y j) = p ij , i=1,2...,n, j=1,2...,m

Incarico di servizio. Utilizzando il servizio, secondo una determinata legge di distribuzione, puoi trovare:

  • serie di distribuzione X e Y, aspettativa matematica M[X], M[Y], varianza D[X], D[Y];
  • covarianza cov(x,y), coefficiente di correlazione r x,y , serie di distribuzione condizionale X, aspettativa condizionale M;
Inoltre, viene data una risposta alla domanda "Le variabili casuali X e Y dipendono?".

Istruzione. Specificare la dimensione della matrice di distribuzione di probabilità (numero di righe e colonne) e la sua forma. La soluzione risultante viene salvata in un file Word.

Esempio 1. Una variabile casuale discreta bidimensionale ha una tabella di distribuzione:

Y/X 1 2 3 4
10 0 0,11 0,12 0,03
20 0 0,13 0,09 0,02
30 0,02 0,11 0,08 0,01
40 0,03 0,11 0,05 q
Trova il valore q e il coefficiente di correlazione di questa variabile casuale.

Decisione. Troviamo il valore q dalla condizione Σp ij = 1
Σp ij = 0,02 + 0,03 + 0,11 + … + 0,03 + 0,02 + 0,01 + q = 1
0,91+q = 1. Da cui q = 0,09

Utilizzando la formula ∑P(x io,y j) = pag io(j=1..n), trova la serie di distribuzione X.

Aspettativa matematica M[Y].
M[y] = 1*0,05 + 2*0,46 + 3*0,34 + 4*0,15 = 2,59
Dispersione D[Y] = 1 2 *0.05 + 2 2 *0.46 + 3 2 *0.34 + 4 2 *0.15 - 2.59 2 = 0.64
Deviazione standardσ(y) = sqrt(D[Y]) = sqrt(0,64) = 0,801

covarianza cov(X,Y) = M - M[X] M[Y] = 2 10 0.11 + 3 10 0.12 + 4 10 0.03 + 2 20 0.13 + 3 20 0.09 + 4 20 0.02 + 1 30 0.02 + 2 30 0.11 + 3 30 0,08 + 4 30 0,01 + 1 40 0,03 + 2 40 0,11 + 3 40 0,05 + 4 40 0,09 - 25,2 2,59 = -0,068
Coefficiente di correlazione rxy = cov(x,y)/σ(x)&sigma(y) = -0,068/(11,531*0,801) = -0,00736

Esempio 2. I dati dell'elaborazione statistica delle informazioni relative ai due indicatori X e Y sono riflessi nella tavola di correlazione. Necessario:

  1. scrivere le serie di distribuzione per X e Y e calcolare le medie campionarie e le deviazioni standard campionarie per esse;
  2. scrivi la serie di distribuzioni condizionali Y/x e calcola le medie condizionali Y/x;
  3. rappresentare graficamente la dipendenza delle medie condizionali Y/x dai valori di X;
  4. calcolare il coefficiente di correlazione campionaria Y su X;
  5. scrivere un'equazione di regressione diretta campionaria;
  6. rappresentare geometricamente i dati della tabella di correlazione e costruire una retta di regressione.
Decisione. Una coppia ordinata (X,Y) di variabili casuali X e Y è chiamata variabile casuale bidimensionale o vettore casuale di uno spazio bidimensionale. Una variabile casuale bidimensionale (X,Y) è anche chiamata sistema di variabili casuali X e Y.
L'insieme di tutti i possibili valori di una variabile casuale discreta con le loro probabilità è chiamato legge di distribuzione di questa variabile casuale.
Una variabile casuale bidimensionale discreta (X,Y) è considerata data se è nota la sua legge di distribuzione:
P(X=x io , Y=y j) = p ij , i=1,2...,n, j=1,2...,m
X/Y20 30 40 50 60
11 2 0 0 0 0
16 4 6 0 0 0
21 0 3 6 2 0
26 0 0 45 8 4
31 0 0 4 6 7
36 0 0 0 0 3
Gli eventi (X=x i , Y=y j) formano un gruppo completo di eventi, quindi la somma di tutte le probabilità p ij ( i=1,2...,n, j=1,2...,m) indicato nella tabella è uguale a 1.
1. Dipendenza di variabili casuali X e Y.
Trova le serie di distribuzione X e Y.
Utilizzando la formula ∑P(x io,y j) = pag io(j=1..n), trova la serie di distribuzione X. Aspettativa matematica M[Y].
M[y] = (20*6 + 30*9 + 40*55 + 50*16 + 60*14)/100 = 42,3
Dispersione D[Y].
G[Y] = (20 2 *6 + 30 2 *9 + 40 2 *55 + 50 2 *16 + 60 2 *14)/100 - 42,3 2 = 99,71
Deviazione standard σ(y).

Poiché, P(X=11,Y=20) = 2≠2 6, allora le variabili casuali X e Y dipendente.
2. Diritto di distribuzione condizionale X.
Legge di distribuzione condizionata X(Y=20).
P(X=11/Y=20) = 2/6 = 0,33
P(X=16/Y=20) = 4/6 = 0,67
P(X=21/Y=20) = 0/6 = 0
P(X=26/Y=20) = 0/6 = 0
P(X=31/Y=20) = 0/6 = 0
P(X=36/Y=20) = 0/6 = 0
Aspettativa condizionale M = 11*0,33 + 16*0,67 + 21*0 + 26*0 + 31*0 + 36*0 = 14,33
Varianza condizionale D = 11 2 *0,33 + 16 2 *0,67 + 21 2 *0 + 26 2 *0 + 31 2 *0 + 36 2 *0 - 14,33 2 = 5,56
Legge di distribuzione condizionata X(Y=30).
P(X=11/Y=30) = 0/9 = 0
P(X=16/Y=30) = 6/9 = 0,67
P(X=21/Y=30) = 3/9 = 0,33
P(X=26/Y=30) = 0/9 = 0
P(X=31/Y=30) = 0/9 = 0
P(X=36/Y=30) = 0/9 = 0
Aspettativa condizionale M = 11*0 + 16*0,67 + 21*0,33 + 26*0 + 31*0 + 36*0 = 17,67
Varianza condizionale D = 11 2 *0 + 16 2 *0,67 + 21 2 *0,33 + 26 2 *0 + 31 2 *0 + 36 2 *0 - 17,67 2 = 5,56
Legge di distribuzione condizionata X(Y=40).
P(X=11/Y=40) = 0/55 = 0
P(X=16/Y=40) = 0/55 = 0
P(X=21/Y=40) = 6/55 = 0,11
P(X=26/Y=40) = 45/55 = 0,82
P(X=31/Y=40) = 4/55 = 0,0727
P(X=36/Y=40) = 0/55 = 0
Aspettativa condizionale M = 11*0 + 16*0 + 21*0,11 + 26*0,82 + 31*0,0727 + 36*0 = 25,82
Varianza condizionale D = 11 2 *0 + 16 2 *0 + 21 2 *0,11 + 26 2 *0,82 + 31 2 *0,0727 + 36 2 *0 - 25,82 2 = 4,51
Legge di distribuzione condizionata X(Y=50).
P(X=11/Y=50) = 0/16 = 0
P(X=16/Y=50) = 0/16 = 0
P(X=21/Y=50) = 2/16 = 0,13
P(X=26/Y=50) = 8/16 = 0,5
P(X=31/Y=50) = 6/16 = 0,38
P(X=36/Y=50) = 0/16 = 0
Aspettativa condizionale M = 11*0 + 16*0 + 21*0,13 + 26*0,5 + 31*0,38 + 36*0 = 27,25
Varianza condizionale D = 11 2 *0 + 16 2 *0 + 21 2 *0,13 + 26 2 *0,5 + 31 2 *0,38 + 36 2 *0 - 27,25 2 = 10,94
Legge di distribuzione condizionata X(Y=60).
P(X=11/Y=60) = 0/14 = 0
P(X=16/Y=60) = 0/14 = 0
P(X=21/Y=60) = 0/14 = 0
P(X=26/Y=60) = 4/14 = 0,29
P(X=31/Y=60) = 7/14 = 0,5
P(X=36/Y=60) = 3/14 = 0,21
Aspettativa condizionale M = 11*0 + 16*0 + 21*0 + 26*0,29 + 31*0,5 + 36*0,21 = 30,64
Varianza condizionale D = 11 2 *0 + 16 2 *0 + 21 2 *0 + 26 2 *0,29 + 31 2 *0,5 + 36 2 *0,21 - 30,64 2 = 12,37
3. Diritto di distribuzione condizionale Y.
Legge di distribuzione condizionata Y(X=11).
P(Y=20/X=11) = 2/2 = 1
P(Y=30/X=11) = 0/2 = 0
P(Y=40/X=11) = 0/2 = 0
P(Y=50/X=11) = 0/2 = 0
P(Y=60/X=11) = 0/2 = 0
Aspettativa condizionale M = 20*1 + 30*0 + 40*0 + 50*0 + 60*0 = 20
Varianza condizionale D = 20 2 *1 + 30 2 *0 + 40 2 *0 + 50 2 *0 + 60 2 *0 - 20 2 = 0
Legge di distribuzione condizionata Y(X=16).
P(Y=20/X=16) = 4/10 = 0,4
P(Y=30/X=16) = 6/10 = 0,6
P(Y=40/X=16) = 0/10 = 0
P(Y=50/X=16) = 0/10 = 0
P(Y=60/X=16) = 0/10 = 0
Aspettativa condizionale M = 20*0,4 + 30*0,6 + 40*0 + 50*0 + 60*0 = 26
Varianza condizionale D = 20 2 *0,4 + 30 2 *0,6 + 40 2 *0 + 50 2 *0 + 60 2 *0 - 26 2 = 24
Legge di distribuzione condizionata Y(X=21).
P(Y=20/X=21) = 0/11 = 0
P(Y=30/X=21) = 3/11 = 0,27
P(Y=40/X=21) = 6/11 = 0,55
P(Y=50/X=21) = 2/11 = 0,18
P(Y=60/X=21) = 0/11 = 0
Aspettativa condizionale M = 20*0 + 30*0,27 + 40*0,55 + 50*0,18 + 60*0 = 39,09
Varianza condizionale D = 20 2 *0 + 30 2 *0,27 + 40 2 *0,55 + 50 2 *0,18 + 60 2 *0 - 39,09 2 = 44,63
Legge di distribuzione condizionata Y(X=26).
P(Y=20/X=26) = 0/57 = 0
P(Y=30/X=26) = 0/57 = 0
P(Y=40/X=26) = 45/57 = 0,79
P(Y=50/X=26) = 8/57 = 0,14
P(Y=60/X=26) = 4/57 = 0,0702
Aspettativa condizionale M = 20*0 + 30*0 + 40*0,79 + 50*0,14 + 60*0,0702 = 42,81
Varianza condizionale D = 20 2 *0 + 30 2 *0 + 40 2 *0,79 + 50 2 *0,14 + 60 2 *0,0702 - 42,81 2 = 34,23
Legge di distribuzione condizionale Y(X=31).
P(Y=20/X=31) = 0/17 = 0
P(Y=30/X=31) = 0/17 = 0
P(Y=40/X=31) = 4/17 = 0,24
P(Y=50/X=31) = 6/17 = 0,35
P(Y=60/X=31) = 7/17 = 0,41
Aspettativa condizionale M = 20*0 + 30*0 + 40*0,24 + 50*0,35 + 60*0,41 = 51,76
Varianza condizionale D = 20 2 *0 + 30 2 *0 + 40 2 *0,24 + 50 2 *0,35 + 60 2 *0,41 - 51,76 2 = 61,59
Legge di distribuzione condizionale Y(X=36).
P(Y=20/X=36) = 0/3 = 0
P(Y=30/X=36) = 0/3 = 0
P(Y=40/X=36) = 0/3 = 0
P(Y=50/X=36) = 0/3 = 0
P(Y=60/X=36) = 3/3 = 1
Aspettativa condizionale M = 20*0 + 30*0 + 40*0 + 50*0 + 60*1 = 60
Varianza condizionale D = 20 2 *0 + 30 2 *0 + 40 2 *0 + 50 2 *0 + 60 2 *1 - 60 2 = 0
covarianza.
cov(X,Y) = M - M[X] M[Y]
cov(X,Y) = (20 11 2 + 20 16 4 + 30 16 6 + 30 21 3 + 40 21 6 + 50 21 2 + 40 26 45 + 50 26 8 + 60 26 4 + 40 31 4 + 50 31 6 + 60 31 7 + 60 36 3)/100 - 25,3 42,3 = 38,11
Se le variabili casuali sono indipendenti, la loro covarianza è zero. Nel nostro caso cov(X,Y) ≠ 0.
Coefficiente di correlazione.


L'equazione di regressione lineare da y a x è:

L'equazione di regressione lineare da x a y è:

Trova le caratteristiche numeriche necessarie.
Campione significa:
x = (20(2 + 4) + 30(6 + 3) + 40(6 + 45 + 4) + 50(2 + 8 + 6) + 60(4 + 7 + 3))/100 = 42,3
y = (20(2 + 4) + 30(6 + 3) + 40(6 + 45 + 4) + 50(2 + 8 + 6) + 60(4 + 7 + 3))/100 = 25,3
dispersioni:
σ 2 x = (20 2 (2 + 4) + 30 2 (6 + 3) + 40 2 (6 + 45 + 4) + 50 2 (2 + 8 + 6) + 60 2 (4 + 7 + 3) )/100 - 42,3 2 = 99,71
σ 2 y = (11 2 (2) + 16 2 (4 + 6) + 21 2 (3 + 6 + 2) + 26 2 (45 + 8 + 4) + 31 2 (4 + 6 + 7) + 36 2 (3))/100 - 25,3 2 = 24,01
Dove otteniamo le deviazioni standard:
σ x = 9,99 e σ y = 4,9
e covarianza:
Cov(x,y) = (20 11 2 + 20 16 4 + 30 16 6 + 30 21 3 + 40 21 6 + 50 21 2 + 40 26 45 + 50 26 8 + 60 26 4 + 40 31 4 + 50 31 6 + 60 31 7 + 60 36 3)/100 - 42,3 25,3 = 38,11
Definiamo il coefficiente di correlazione:


Scriviamo le equazioni delle rette di regressione y(x):

e calcolando, otteniamo:
yx = 0,38x + 9,14
Scriviamo le equazioni delle rette di regressione x(y):

e calcolando, otteniamo:
x y = 1,59 y + 2,15
Se costruiamo i punti definiti dalla tabella e le rette di regressione, vedremo che entrambe le rette passano per il punto con le coordinate (42.3; 25.3) ei punti si trovano vicino alle rette di regressione.
Significato del coefficiente di correlazione.

Secondo la tabella di Student con livello di significatività α=0.05 e gradi di libertà k=100-m-1 = 98 troviamo t crit:
t critico (n-m-1;α/2) = (98;0,025) = 1,984
dove m = 1 è il numero di variabili esplicative.
Se t obs > t è critico, allora il valore ottenuto del coefficiente di correlazione viene riconosciuto come significativo (si rifiuta l'ipotesi nulla che affermi che il coefficiente di correlazione sia uguale a zero).
Poiché t obl > t crit, respingiamo l'ipotesi che il coefficiente di correlazione sia uguale a 0. In altre parole, il coefficiente di correlazione è statisticamente significativo.

Esercizio. Nella tabella è riportato il numero di colpi di coppie di valori delle variabili casuali X e Y negli intervalli corrispondenti. Da questi dati, trovare il coefficiente di correlazione campionaria e le equazioni campionarie delle rette di regressione Y su X e X su Y .
Decisione

Esempio. La distribuzione di probabilità di una variabile casuale bidimensionale (X, Y) è data da una tabella. Trova le leggi di distribuzione delle grandezze componenti X, Y e il coefficiente di correlazione p(X, Y).
Scarica la soluzione

Esercizio. Un valore discreto bidimensionale (X, Y) è dato da una legge di distribuzione. Trova le leggi di distribuzione delle componenti X e Y, la covarianza e il coefficiente di correlazione.

Definizione 2.7. è una coppia di numeri casuali (X, Y), o un punto sul piano delle coordinate (Fig. 2.11).

Riso. 2.11.

Una variabile casuale bidimensionale è un caso speciale di una variabile casuale multidimensionale, o vettore casuale.

Definizione 2.8. Vettore casuale -è una funzione casuale?,(/) con un insieme finito di possibili valori di argomento t, il cui valore per qualsiasi valore tè una variabile casuale.

Una variabile casuale bidimensionale si dice continua se le sue coordinate sono continue e discreta se le sue coordinate sono discrete.

Stabilire la legge di distribuzione delle variabili casuali bidimensionali significa stabilire una corrispondenza tra i suoi possibili valori e la probabilità di questi valori. Secondo le modalità di impostazione, le variabili casuali sono divise in continue e discrete, sebbene esistano modi generali per impostare la legge di distribuzione di qualsiasi RV.

Variabile casuale bidimensionale discreta

Una variabile casuale bidimensionale discreta viene specificata utilizzando una tabella di distribuzione (Tabella 2.1).

Tabella 2.1

Tabella di assegnazione (allocazione congiunta) CB ( X, U)

Gli elementi della tabella sono definiti dalla formula

Proprietà dell'elemento della tabella di distribuzione:

Viene chiamata la distribuzione su ciascuna coordinata unidimensionale o marginale:

R 1> = P(X =.d,) - distribuzione marginale di SW X;

p^2) = P(Y= y,)- distribuzione marginale di SV U.

Comunicazione della distribuzione congiunta di CB X e Y, data dall'insieme delle probabilità [p () ), i = 1,..., n,j = 1,..., t(tabella di distribuzione) e distribuzione marginale.


Allo stesso modo per SV U p-2)= X p, g

Problema 2.14. Dato:

Variabile casuale 2D continua

/(X, y)dxdy- elemento di probabilità per una variabile aleatoria bidimensionale (X, Y) - probabilità di colpire una variabile aleatoria (X, Y) in un rettangolo con i lati cbc, dy A dx, dy -* 0:

f(x, y) - densità di distribuzione variabile casuale bidimensionale (X, Y). Compito /(x, y) diamo informazioni complete sulla distribuzione di una variabile casuale bidimensionale.

Le distribuzioni marginali sono specificate come segue: per X - dalla densità di distribuzione di CB X/,(x); su Y- Densità di distribuzione SV f>(y).

Impostazione della legge di distribuzione di una variabile casuale bidimensionale mediante la funzione di distribuzione

Un modo universale per specificare la legge di distribuzione per una variabile casuale bidimensionale discreta o continua è la funzione di distribuzione F(x, y).

Definizione 2.9. Funzione di distribuzione F(x, y)- probabilità di occorrenza congiunta di eventi (Xy), ovverosia F(x0,y n) = = P(X y), lanciato sul piano delle coordinate, cadono in un quadrante infinito con un vertice nel punto M(x 0, tu io)(nell'area ombreggiata in Fig. 2.12).

Riso. 2.12. Illustrazione della funzione di distribuzione F( x, y)

Proprietà della funzione F(x, y)

  • 1) 0 1;
  • 2) F(-oo,-oo) = F(x,-oo) = F(-oo, y) = 0; F( oo, oo) = 1;
  • 3) F(x, y)- non decrescente in ogni argomento;
  • 4) F(x, y) - continua a sinistra e in basso;
  • 5) consistenza delle distribuzioni:

F(x, X: F(x, oo) = F,(x); F(y, oo) - distribuzione marginale sopra Y F( ooh, y) = F 2 (y). Connessione /(x, y) insieme a F(x, y):

Relazione tra densità articolare e densità marginale. Dana f(x, y). Otteniamo le densità di distribuzione marginale f(x),f 2 (y)".


Il caso delle coordinate indipendenti di una variabile casuale bidimensionale

Definizione 2.10. SW X e Yindipendente(nc) se eventuali eventi associati a ciascuno di questi camper sono indipendenti. Dalla definizione di nc CB segue:

  • 1 )Pij = p X) pf
  • 2 )F(x,y) = Fl (x)F 2 (y).

Si scopre che per SW indipendenti X e Y completato e

3 )f(x,y) = J(x)f,(y).

Dimostriamolo per SW indipendenti X e Y2) 3). Prova, a) Sia 2), cioè

allo stesso tempo F(x,y) = fJ f(u,v)dudv, da cui segue 3);

b) lascia che 3 ora mantenga, quindi


quelli. vero 2).

Consideriamo i compiti.

Problema 2.15. La distribuzione è data dalla seguente tabella:

Costruiamo distribuzioni marginali:

Noi abbiamo P(X = 3, U = 4) = 0,17 * P(X = 3) P (Y \u003d 4) \u003d 0,1485 => => SV X e dipendenti.

Funzione di distribuzione:


Problema 2.16. La distribuzione è data dalla seguente tabella:

Noi abbiamo P tl = 0,2 0,3 = 0,06; P 12 \u003d 0,2? 0,7 = 0,14; P2l = 0,8 ? 0,3 = = 0,24; R 22 - 0,8 0,7 = 0,56 => SW X e Y nz.

Problema 2.17. Dana /(x, y) = 1/a esp| -0,5(d "+ 2xy+ 5d/ 2)]. Trovare Oh) e /Ay)-

Decisione

(calcola te stesso).