Aléatoire bidimensionnel. Variable aléatoire 2D

Une paire ordonnée (X , Y) de variables aléatoires X et Y est appelée une variable aléatoire à deux dimensions, ou un vecteur aléatoire d'un espace à deux dimensions. Une variable aléatoire bidimensionnelle (X,Y) est aussi appelée un système de variables aléatoires X et Y. L'ensemble de toutes les valeurs possibles d'une variable aléatoire discrète avec leurs probabilités est appelé la loi de distribution de cette variable aléatoire. Une variable aléatoire bidimensionnelle discrète (X, Y) est considérée comme donnée si sa loi de distribution est connue :

P(X=x je , Y=y j) = p ij , je=1,2...,n, j=1,2...,m

Mission de service. En utilisant le service, selon une loi de distribution donnée, vous pouvez trouver :

  • séries de distribution X et Y, espérance mathématique M[X], M[Y], variance D[X], D[Y] ;
  • covariance cov(x,y), coefficient de corrélation r x,y , série de distribution conditionnelle X, espérance conditionnelle M ;
De plus, une réponse est donnée à la question "Les variables aléatoires X et Y sont-elles dépendantes ?".

Instruction. Spécifiez la dimension de la matrice de distribution de probabilité (nombre de lignes et de colonnes) et sa forme. La solution résultante est enregistrée dans un fichier Word.

Exemple 1. Une variable aléatoire discrète bidimensionnelle a une table de distribution :

Y/X 1 2 3 4
10 0 0,11 0,12 0,03
20 0 0,13 0,09 0,02
30 0,02 0,11 0,08 0,01
40 0,03 0,11 0,05 q
Trouvez la valeur q et le coefficient de corrélation de cette variable aléatoire.

Décision. On trouve la valeur q à partir de la condition Σp ij = 1
Σp ij = 0,02 + 0,03 + 0,11 + … + 0,03 + 0,02 + 0,01 + q = 1
0,91+q = 1. D'où q = 0,09

En utilisant la formule ∑P(x je,y j) = p je(j=1..n), trouver la série de distribution X.

Espérance mathématique M[Y].
M[y] = 1*0,05 + 2*0,46 + 3*0,34 + 4*0,15 = 2,59
Dispersion D[Y] = 1 2 *0.05 + 2 2 *0.46 + 3 2 *0.34 + 4 2 *0.15 - 2.59 2 = 0.64
Écart-typeσ(y) = sqrt(D[Y]) = sqrt(0.64) = 0.801

covariance cov(X,Y) = M - M[X] M[Y] = 2 10 0,11 + 3 10 0,12 + 4 10 0,03 + 2 20 0,13 + 3 20 0,09 + 4 20 0,02 + 1 30 0,02 + 2 30 0,11 + 3 30 0,08 + 4 30 0,01 + 1 40 0,03 + 2 40 0,11 + 3 40 0,05 + 4 40 0,09 - 25,2 2,59 = -0,068
Coefficient de corrélation rxy = cov(x,y)/σ(x)&sigma(y) = -0,068/(11,531*0,801) = -0,00736

Exemple 2 . Les données de traitement statistique des informations relatives à deux indicateurs X et Y sont reflétées dans le tableau de correspondance. Obligatoire:

  1. écrire des séries de distribution pour X et Y et calculer des moyennes d'échantillons et des écarts-types d'échantillons pour celles-ci ;
  2. écrire la série de distribution conditionnelle Y/x et calculer les moyennes conditionnelles Y/x ;
  3. représenter graphiquement la dépendance des moyennes conditionnelles Y/x sur les valeurs de X ;
  4. calculer le coefficient de corrélation d'échantillon Y sur X ;
  5. écrire un exemple d'équation de régression directe ;
  6. représenter géométriquement les données du tableau de correspondance et construire une droite de régression.
Décision. Une paire ordonnée (X,Y) de variables aléatoires X et Y est appelée une variable aléatoire à deux dimensions, ou un vecteur aléatoire d'un espace à deux dimensions. Une variable aléatoire bidimensionnelle (X,Y) est aussi appelée un système de variables aléatoires X et Y.
L'ensemble de toutes les valeurs possibles d'une variable aléatoire discrète avec leurs probabilités est appelé la loi de distribution de cette variable aléatoire.
Une variable aléatoire bidimensionnelle discrète (X,Y) est considérée comme donnée si sa loi de distribution est connue :
P(X=x je , Y=y j) = p ij , i=1,2...,n, j=1,2...,m
X/Y20 30 40 50 60
11 2 0 0 0 0
16 4 6 0 0 0
21 0 3 6 2 0
26 0 0 45 8 4
31 0 0 4 6 7
36 0 0 0 0 3
Les événements (X=x i , Y=y j) forment un groupe complet d'événements, donc la somme de toutes les probabilités p ij ( i=1,2...,n, j=1,2...,m) indiqué dans le tableau est égal à 1.
1. Dépendance des variables aléatoires X et Y.
Trouvez les séries de distribution X et Y.
En utilisant la formule ∑P(x je,y j) = p je(j=1..n), trouver la série de distribution X. Espérance mathématique M[Y].
M[a] = (20*6 + 30*9 + 40*55 + 50*16 + 60*14)/100 = 42,3
Dispersion D[Y].
D[Y] = (20 2 *6 + 30 2 *9 + 40 2 *55 + 50 2 *16 + 60 2 *14)/100 - 42,3 2 = 99,71
Écart type σ(y).

Puisque, P(X=11,Y=20) = 2≠2 6, alors les variables aléatoires X et Y dépendant.
2. Loi de distribution conditionnelle X.
Loi de distribution conditionnelle X(Y=20).
P(X=11/Y=20) = 2/6 = 0,33
P(X=16/Y=20) = 4/6 = 0,67
P(X=21/Y=20) = 0/6 = 0
P(X=26/Y=20) = 0/6 = 0
P(X=31/Y=20) = 0/6 = 0
P(X=36/Y=20) = 0/6 = 0
Espérance conditionnelle M = 11*0,33 + 16*0,67 + 21*0 + 26*0 + 31*0 + 36*0 = 14,33
Variance conditionnelle D = 11 2 *0,33 + 16 2 *0,67 + 21 2 *0 + 26 2 *0 + 31 2 *0 + 36 2 *0 - 14,33 2 = 5,56
Loi de distribution conditionnelle X(Y=30).
P(X=11/Y=30) = 0/9 = 0
P(X=16/Y=30) = 6/9 = 0,67
P(X=21/Y=30) = 3/9 = 0,33
P(X=26/Y=30) = 0/9 = 0
P(X=31/Y=30) = 0/9 = 0
P(X=36/Y=30) = 0/9 = 0
Espérance conditionnelle M = 11*0 + 16*0,67 + 21*0,33 + 26*0 + 31*0 + 36*0 = 17,67
Variance conditionnelle D = 11 2 *0 + 16 2 *0,67 + 21 2 *0,33 + 26 2 *0 + 31 2 *0 + 36 2 *0 - 17,67 2 = 5,56
Loi de distribution conditionnelle X(Y=40).
P(X=11/Y=40) = 0/55 = 0
P(X=16/Y=40) = 0/55 = 0
P(X=21/Y=40) = 6/55 = 0,11
P(X=26/Y=40) = 45/55 = 0,82
P(X=31/Y=40) = 4/55 = 0,0727
P(X=36/Y=40) = 0/55 = 0
Espérance conditionnelle M = 11*0 + 16*0 + 21*0,11 + 26*0,82 + 31*0,0727 + 36*0 = 25,82
Écart conditionnel D = 11 2 *0 + 16 2 *0 + 21 2 *0,11 + 26 2 *0,82 + 31 2 *0,0727 + 36 2 *0 - 25,82 2 = 4,51
Loi de distribution conditionnelle X(Y=50).
P(X=11/Y=50) = 0/16 = 0
P(X=16/Y=50) = 0/16 = 0
P(X=21/Y=50) = 2/16 = 0,13
P(X=26/Y=50) = 8/16 = 0,5
P(X=31/Y=50) = 6/16 = 0,38
P(X=36/Y=50) = 0/16 = 0
Espérance conditionnelle M = 11*0 + 16*0 + 21*0,13 + 26*0,5 + 31*0,38 + 36*0 = 27,25
Écart conditionnel D = 11 2 *0 + 16 2 *0 + 21 2 *0,13 + 26 2 *0,5 + 31 2 *0,38 + 36 2 *0 - 27,25 2 = 10,94
Loi de distribution conditionnelle X(Y=60).
P(X=11/Y=60) = 0/14 = 0
P(X=16/Y=60) = 0/14 = 0
P(X=21/Y=60) = 0/14 = 0
P(X=26/Y=60) = 4/14 = 0,29
P(X=31/Y=60) = 7/14 = 0,5
P(X=36/Y=60) = 3/14 = 0,21
Espérance conditionnelle M = 11*0 + 16*0 + 21*0 + 26*0,29 + 31*0,5 + 36*0,21 = 30,64
Écart conditionnel D = 11 2 *0 + 16 2 *0 + 21 2 *0 + 26 2 *0,29 + 31 2 *0,5 + 36 2 *0,21 - 30,64 2 = 12,37
3. Loi de distribution conditionnelle Y.
Loi de distribution conditionnelle Y(X=11).
P(Y=20/X=11) = 2/2 = 1
P(Y=30/X=11) = 0/2 = 0
P(Y=40/X=11) = 0/2 = 0
P(Y=50/X=11) = 0/2 = 0
P(Y=60/X=11) = 0/2 = 0
Espérance conditionnelle M = 20*1 + 30*0 + 40*0 + 50*0 + 60*0 = 20
Variance conditionnelle D = 20 2 *1 + 30 2 *0 + 40 2 *0 + 50 2 *0 + 60 2 *0 - 20 2 = 0
Loi de distribution conditionnelle Y(X=16).
P(Y=20/X=16) = 4/10 = 0,4
P(Y=30/X=16) = 6/10 = 0,6
P(Y=40/X=16) = 0/10 = 0
P(Y=50/X=16) = 0/10 = 0
P(Y=60/X=16) = 0/10 = 0
Espérance conditionnelle M = 20*0,4 + 30*0,6 + 40*0 + 50*0 + 60*0 = 26
Écart conditionnel D = 20 2 *0,4 + 30 2 *0,6 + 40 2 *0 + 50 2 *0 + 60 2 *0 - 26 2 = 24
Loi de distribution conditionnelle Y(X=21).
P(Y=20/X=21) = 0/11 = 0
P(Y=30/X=21) = 3/11 = 0,27
P(Y=40/X=21) = 6/11 = 0,55
P(Y=50/X=21) = 2/11 = 0,18
P(Y=60/X=21) = 0/11 = 0
Espérance conditionnelle M = 20*0 + 30*0,27 + 40*0,55 + 50*0,18 + 60*0 = 39,09
Écart conditionnel D = 20 2 *0 + 30 2 *0,27 + 40 2 *0,55 + 50 2 *0,18 + 60 2 *0 - 39,09 2 = 44,63
Loi de distribution conditionnelle Y(X=26).
P(Y=20/X=26) = 0/57 = 0
P(Y=30/X=26) = 0/57 = 0
P(Y=40/X=26) = 45/57 = 0,79
P(Y=50/X=26) = 8/57 = 0,14
P(Y=60/X=26) = 4/57 = 0,0702
Espérance conditionnelle M = 20*0 + 30*0 + 40*0,79 + 50*0,14 + 60*0,0702 = 42,81
Écart conditionnel D = 20 2 *0 + 30 2 *0 + 40 2 *0,79 + 50 2 *0,14 + 60 2 *0,0702 - 42,81 2 = 34,23
Loi de distribution conditionnelle Y(X=31).
P(Y=20/X=31) = 0/17 = 0
P(Y=30/X=31) = 0/17 = 0
P(Y=40/X=31) = 4/17 = 0,24
P(Y=50/X=31) = 6/17 = 0,35
P(Y=60/X=31) = 7/17 = 0,41
Espérance conditionnelle M = 20*0 + 30*0 + 40*0,24 + 50*0,35 + 60*0,41 = 51,76
Écart conditionnel D = 20 2 *0 + 30 2 *0 + 40 2 *0,24 + 50 2 *0,35 + 60 2 *0,41 - 51,76 2 = 61,59
Loi de distribution conditionnelle Y(X=36).
P(Y=20/X=36) = 0/3 = 0
P(Y=30/X=36) = 0/3 = 0
P(Y=40/X=36) = 0/3 = 0
P(Y=50/X=36) = 0/3 = 0
P(Y=60/X=36) = 3/3 = 1
Espérance conditionnelle M = 20*0 + 30*0 + 40*0 + 50*0 + 60*1 = 60
Variance conditionnelle D = 20 2 *0 + 30 2 *0 + 40 2 *0 + 50 2 *0 + 60 2 *1 - 60 2 = 0
covariance.
cov(X,Y) = M - M[X] M[Y]
cov(X,Y) = (20 11 2 + 20 16 4 + 30 16 6 + 30 21 3 + 40 21 6 + 50 21 2 + 40 26 45 + 50 26 8 + 60 26 4 + 40 31 4 + 50 31 6 + 60 31 7 + 60 36 3)/100 - 25,3 42,3 = 38,11
Si les variables aléatoires sont indépendantes, alors leur covariance est nulle. Dans notre cas cov(X,Y) ≠ 0.
Coefficient de corrélation.


L'équation de régression linéaire de y à x est :

L'équation de régression linéaire de x à y est :

Trouver les caractéristiques numériques nécessaires.
Échantillon signifie :
x = (20(2 + 4) + 30(6 + 3) + 40(6 + 45 + 4) + 50(2 + 8 + 6) + 60(4 + 7 + 3))/100 = 42,3
y = (20(2 + 4) + 30(6 + 3) + 40(6 + 45 + 4) + 50(2 + 8 + 6) + 60(4 + 7 + 3))/100 = 25,3
dispersions :
σ 2 x = (20 2 (2 + 4) + 30 2 (6 + 3) + 40 2 (6 + 45 + 4) + 50 2 (2 + 8 + 6) + 60 2 (4 + 7 + 3) )/100 - 42,3 2 = 99,71
σ 2 y = (11 2 (2) + 16 2 (4 + 6) + 21 2 (3 + 6 + 2) + 26 2 (45 + 8 + 4) + 31 2 (4 + 6 + 7) + 36 2 (3))/100 - 25,3 2 = 24,01
Où trouve-t-on les écarts-types :
σx = 9,99 et σy = 4,9
et covariance :
Cov(x,y) = (20 11 2 + 20 16 4 + 30 16 6 + 30 21 3 + 40 21 6 + 50 21 2 + 40 26 45 + 50 26 8 + 60 26 4 + 40 31 4 + 50 31 6 + 60 31 7 + 60 36 3)/100 - 42,3 25,3 = 38,11
Définissons le coefficient de corrélation :


Écrivons les équations des droites de régression y(x) :

et en calculant, on obtient :
yx = 0,38x + 9,14
Écrivons les équations des droites de régression x(y) :

et en calculant, on obtient :
x y = 1,59 y + 2,15
Si nous construisons les points définis par le tableau et les droites de régression, nous verrons que les deux droites passent par le point de coordonnées (42,3 ; 25,3) et que les points sont situés à proximité des droites de régression.
Signification du coefficient de corrélation.

D'après la table de Student avec seuil de signification α=0,05 et degrés de liberté k=100-m-1 = 98 on trouve tcrit :
tcrit (n-m-1 ;α/2) = (98 ;0,025) = 1,984
où m = 1 est le nombre de variables explicatives.
Si t obs > t est critique, alors la valeur obtenue du coefficient de corrélation est reconnue comme significative (l'hypothèse nulle affirmant que le coefficient de corrélation est égal à zéro est rejetée).
Puisque t obl > t crit, nous rejetons l'hypothèse que le coefficient de corrélation est égal à 0. En d'autres termes, le coefficient de corrélation est statistiquement significatif.

Exercer. Le nombre de résultats de paires de valeurs de variables aléatoires X et Y dans les intervalles correspondants est indiqué dans le tableau. À partir de ces données, trouvez le coefficient de corrélation d'échantillon et les équations d'échantillon des droites de régression Y sur X et X sur Y .
Décision

Exemple. La distribution de probabilité d'une variable aléatoire bidimensionnelle (X, Y) est donnée par un tableau. Trouver les lois de distribution des grandeurs composantes X, Y et le coefficient de corrélation p(X, Y).
Télécharger la solution

Exercer. Une valeur discrète bidimensionnelle (X, Y) est donnée par une loi de distribution. Trouver les lois de distribution des composantes X et Y, la covariance et le coefficient de corrélation.

Soit une variable aléatoire bidimensionnelle $(X,Y)$.

Définition 1

La loi de distribution d'une variable aléatoire bidimensionnelle $(X,Y)$ est l'ensemble des paires possibles de nombres $(x_i,\ y_j)$ (où $x_i \epsilon X,\ y_j \epsilon Y$) et leurs probabilités $p_(ij)$ .

Le plus souvent, la loi de distribution d'une variable aléatoire bidimensionnelle est écrite sous forme de tableau (tableau 1).

Figure 1. Loi de distribution d'une variable aléatoire bidimensionnelle.

Rappelons-nous maintenant théorème sur l'addition des probabilités d'événements indépendants.

Théorème 1

La probabilité de la somme d'un nombre fini d'événements indépendants $(\ A)_1$, $(\ A)_2$, ... ,$\ (\ A)_n$ est calculée par la formule :

A l'aide de cette formule, on peut obtenir des lois de distribution pour chaque composante d'une variable aléatoire bidimensionnelle, soit :

De là, il s'ensuit que la somme de toutes les probabilités d'un système à deux dimensions a la forme suivante :

Considérons en détail (pas à pas) le problème lié au concept de la loi de distribution d'une variable aléatoire à deux dimensions.

Exemple 1

La loi de distribution d'une variable aléatoire bidimensionnelle est donnée par le tableau suivant :

Figure 2.

Trouver les lois de distribution des variables aléatoires $X,\ Y$, $X+Y$ et vérifier dans chaque cas que la somme totale des probabilités est égale à un.

  1. Trouvons d'abord la distribution de la variable aléatoire $X$. La variable aléatoire $X$ peut prendre les valeurs $x_1=2,$ $x_2=3$, $x_3=5$. Pour trouver la distribution, nous utiliserons le théorème 1.

Trouvons d'abord la somme des probabilités $x_1$ comme suit :

figure 3

De même, nous trouvons $P\left(x_2\right)$ et $P\left(x_3\right)$ :

\ \

Figure 4

  1. Trouvons maintenant la distribution de la variable aléatoire $Y$. La variable aléatoire $Y$ peut prendre les valeurs $x_1=1,$ $x_2=3$, $x_3=4$. Pour trouver la distribution, nous utiliserons le théorème 1.

Trouvons d'abord la somme des probabilités $y_1$ comme suit :

Figure 5

De même, nous trouvons $P\left(y_2\right)$ et $P\left(y_3\right)$ :

\ \

Ainsi, la loi de distribution de la quantité $X$ a la forme suivante :

Figure 6

Vérifions le respect de l'égalité de la somme totale des probabilités :

  1. Il reste à trouver la loi de distribution de la variable aléatoire $X+Y$.

Désignons-le par commodité par $Z$ : $Z=X+Y$.

Voyons d'abord quelles valeurs peut prendre cette quantité. Pour ce faire, nous allons additionner deux à deux les valeurs de $X$ et $Y$. Nous obtenons les valeurs suivantes : 3, 4, 6, 5, 6, 8, 6, 7, 9. Maintenant, en supprimant les valeurs correspondantes, nous obtenons que la variable aléatoire $X+Y$ peut prendre les valeurs $z_1 =3,\ z_2=4 ,\ z_3=5,\ z_4=6,\ z_5=7,\ z_6=8,\ z_7=9.\ $

Trouvons d'abord $P(z_1)$. Comme la valeur de $z_1$ est unique, elle se trouve comme suit :

Figure 7

Toutes les probabilités sont trouvées de la même manière, sauf pour $P(z_4)$ :

Trouvons maintenant $P(z_4)$ comme suit :

Figure 8

Ainsi, la loi de distribution pour $Z$ a la forme suivante :

Figure 9

Vérifions le respect de l'égalité de la somme totale des probabilités :

Définition. Si deux variables aléatoires sont données sur le même espace d'événements élémentaires X et Oui, alors ils disent que c'est donné variable aléatoire bidimensionnelle (X,Y) .

Exemple. La machine emboutit les tuiles en acier. Longueur contrôlée X et largeur Oui. − SW bidimensionnel.

SW X et Oui ont leurs propres fonctions de distribution et d'autres caractéristiques.

Définition. La fonction de distribution d'une variable aléatoire bidimensionnelle (X, Y) s'appelle une fonction.

Définition. La loi de distribution d'une variable aléatoire bidimensionnelle discrète (X, Y) appelé un tableau

Pour un SW discret à deux dimensions.

Propriétés :

2) si , alors ; si donc ;

4) − fonction de répartition X;

− fonction de répartition Y.

Probabilité d'atteindre les valeurs du SW bidimensionnel dans le rectangle :

Définition. Variable aléatoire 2D (X, Y) appelé continu si sa fonction de distribution est continue sur et a partout (à l'exception possible d'un nombre fini de courbes) une dérivée partielle mixte continue du 2ème ordre .

Définition. La densité de la distribution de probabilité conjointe du SW continu bidimensionnel s'appelle une fonction.

Alors évidemment .

Exemple 1 Le SW continu bidimensionnel est donné par la fonction de distribution

Alors la densité de distribution a la forme

Exemple 2 Le SW continu bidimensionnel est donné par la densité de distribution

Trouvons sa fonction de distribution :

Propriétés :

3) pour n'importe quel domaine.

Soit connue la densité de distribution conjointe. Ensuite, la densité de distribution de chacune des composantes du SW bidimensionnel se trouve comme suit :

Exemple 2 (suite).

Les densités de distribution des composantes SW bidimensionnelles sont appelées par certains auteurs marginal densités de distribution de probabilité .

Lois conditionnelles de distribution des composants du système de RV discret.

Probabilité conditionnelle , où .

Loi de distribution conditionnelle du composant Xà :

X
R

De même pour , où .

Faisons une loi de distribution conditionnelle Xà Y= 2.

Alors la loi de distribution conditionnelle

X -1
R

Définition. La densité de distribution conditionnelle de la composante X à une valeur donnée Y=y appelé .

De la même manière: .

Définition. conditionnel mathématique en attente de SW discret Y at est appelé , où − voir ci-dessus.

Ainsi, .

Pour continu SW Oui .

est évidemment fonction de l'argument X. Cette fonction s'appelle fonction de régression Y sur X .

De même défini fonction de régression x sur y : .

Théorème 5. (Sur la fonction de distribution des VR indépendants)

SW X et Oui

Conséquence. SW continu X et Oui sont indépendants si et seulement si .

Dans l'exemple 1 avec . Par conséquent, SW X et Oui indépendant.

Caractéristiques numériques des composantes d'une variable aléatoire bidimensionnelle

Pour CB discret :

Pour SW continu : .

La dispersion et l'écart type pour tous les SW sont déterminés par les mêmes formules que nous connaissons :

Définition. La pointe s'appelle centre de diffusion SW bidimensionnel.

Définition. Covariance (moment de corrélation) NE s'appelle

Pour SW discret : .

Pour SW continu : .

Formule de calcul : .

Pour les OC indépendants.

L'inconvénient de la caractéristique est sa dimension (le carré de l'unité de mesure des composants). La quantité suivante est exempte de ce défaut.

Définition. Coefficient de corrélation SW X et Oui appelé

Pour les OC indépendants.

Pour toute paire de SW . Il est connu que si et seulement si, où.

Définition. SW X et Oui appelé non corrélé , si .

Relation entre corrélation et dépendance de SW :

− si CB X et Oui corrélée, c'est-à-dire , alors ils sont dépendants ; l'inverse n'est pas vrai ;

− si CB X et Oui indépendant, alors ; le contraire n'est pas vrai.

Remarque 1. Si SW X et Oui répartis selon la loi normale et , alors ils sont indépendants.

Remarque 2. Valeur pratique comme mesure de dépendance n'est justifiée que lorsque la distribution conjointe de la paire est normale ou approximativement normale. Pour SW arbitraire X et Oui vous pouvez arriver à une conclusion erronée, c'est-à-dire Peut être même quand X et Oui associée à une stricte relation fonctionnelle.

Remarque 3. En statistique mathématique, une corrélation est une dépendance probabiliste (statistique) entre des grandeurs qui, en général, n'a pas un caractère strictement fonctionnel. La dépendance de corrélation se produit lorsque l'une des quantités dépend non seulement de la seconde donnée, mais également d'un certain nombre de facteurs aléatoires, ou lorsque parmi les conditions dont dépend l'une ou l'autre quantité, il existe des conditions communes aux deux.

Exemple 4 Pour SW X et Ouià partir de l'exemple 3 trouver .

Décision.

Exemple 5 La densité de distribution conjointe du SW bidimensionnel est donnée.

Une paire ordonnée (X , Y) de variables aléatoires X et Y est appelée une variable aléatoire à deux dimensions, ou un vecteur aléatoire d'un espace à deux dimensions. Une variable aléatoire bidimensionnelle (X,Y) est aussi appelée un système de variables aléatoires X et Y. L'ensemble de toutes les valeurs possibles d'une variable aléatoire discrète avec leurs probabilités est appelé la loi de distribution de cette variable aléatoire. Une variable aléatoire bidimensionnelle discrète (X, Y) est considérée comme donnée si sa loi de distribution est connue :

P(X=x je , Y=y j) = p ij , je=1,2...,n, j=1,2...,m

Mission de service. En utilisant le service, selon une loi de distribution donnée, vous pouvez trouver :

  • séries de distribution X et Y, espérance mathématique M[X], M[Y], variance D[X], D[Y] ;
  • covariance cov(x,y), coefficient de corrélation r x,y , série de distribution conditionnelle X, espérance conditionnelle M ;
De plus, une réponse est donnée à la question "Les variables aléatoires X et Y sont-elles dépendantes ?".

Instruction. Spécifiez la dimension de la matrice de distribution de probabilité (nombre de lignes et de colonnes) et sa forme. La solution résultante est enregistrée dans un fichier Word.

Exemple 1. Une variable aléatoire discrète bidimensionnelle a une table de distribution :

Y/X 1 2 3 4
10 0 0,11 0,12 0,03
20 0 0,13 0,09 0,02
30 0,02 0,11 0,08 0,01
40 0,03 0,11 0,05 q
Trouvez la valeur q et le coefficient de corrélation de cette variable aléatoire.

Décision. On trouve la valeur q à partir de la condition Σp ij = 1
Σp ij = 0,02 + 0,03 + 0,11 + … + 0,03 + 0,02 + 0,01 + q = 1
0,91+q = 1. D'où q = 0,09

En utilisant la formule ∑P(x je,y j) = p je(j=1..n), trouver la série de distribution X.

Espérance mathématique M[Y].
M[y] = 1*0,05 + 2*0,46 + 3*0,34 + 4*0,15 = 2,59
Dispersion D[Y] = 1 2 *0.05 + 2 2 *0.46 + 3 2 *0.34 + 4 2 *0.15 - 2.59 2 = 0.64
Écart-typeσ(y) = sqrt(D[Y]) = sqrt(0.64) = 0.801

covariance cov(X,Y) = M - M[X] M[Y] = 2 10 0,11 + 3 10 0,12 + 4 10 0,03 + 2 20 0,13 + 3 20 0,09 + 4 20 0,02 + 1 30 0,02 + 2 30 0,11 + 3 30 0,08 + 4 30 0,01 + 1 40 0,03 + 2 40 0,11 + 3 40 0,05 + 4 40 0,09 - 25,2 2,59 = -0,068
Coefficient de corrélation rxy = cov(x,y)/σ(x)&sigma(y) = -0,068/(11,531*0,801) = -0,00736

Exemple 2 . Les données de traitement statistique des informations relatives à deux indicateurs X et Y sont reflétées dans le tableau de correspondance. Obligatoire:

  1. écrire des séries de distribution pour X et Y et calculer des moyennes d'échantillons et des écarts-types d'échantillons pour celles-ci ;
  2. écrire la série de distribution conditionnelle Y/x et calculer les moyennes conditionnelles Y/x ;
  3. représenter graphiquement la dépendance des moyennes conditionnelles Y/x sur les valeurs de X ;
  4. calculer le coefficient de corrélation d'échantillon Y sur X ;
  5. écrire un exemple d'équation de régression directe ;
  6. représenter géométriquement les données du tableau de correspondance et construire une droite de régression.
Décision. Une paire ordonnée (X,Y) de variables aléatoires X et Y est appelée une variable aléatoire à deux dimensions, ou un vecteur aléatoire d'un espace à deux dimensions. Une variable aléatoire bidimensionnelle (X,Y) est aussi appelée un système de variables aléatoires X et Y.
L'ensemble de toutes les valeurs possibles d'une variable aléatoire discrète avec leurs probabilités est appelé la loi de distribution de cette variable aléatoire.
Une variable aléatoire bidimensionnelle discrète (X,Y) est considérée comme donnée si sa loi de distribution est connue :
P(X=x je , Y=y j) = p ij , i=1,2...,n, j=1,2...,m
X/Y20 30 40 50 60
11 2 0 0 0 0
16 4 6 0 0 0
21 0 3 6 2 0
26 0 0 45 8 4
31 0 0 4 6 7
36 0 0 0 0 3
Les événements (X=x i , Y=y j) forment un groupe complet d'événements, donc la somme de toutes les probabilités p ij ( i=1,2...,n, j=1,2...,m) indiqué dans le tableau est égal à 1.
1. Dépendance des variables aléatoires X et Y.
Trouvez les séries de distribution X et Y.
En utilisant la formule ∑P(x je,y j) = p je(j=1..n), trouver la série de distribution X. Espérance mathématique M[Y].
M[a] = (20*6 + 30*9 + 40*55 + 50*16 + 60*14)/100 = 42,3
Dispersion D[Y].
D[Y] = (20 2 *6 + 30 2 *9 + 40 2 *55 + 50 2 *16 + 60 2 *14)/100 - 42,3 2 = 99,71
Écart type σ(y).

Puisque, P(X=11,Y=20) = 2≠2 6, alors les variables aléatoires X et Y dépendant.
2. Loi de distribution conditionnelle X.
Loi de distribution conditionnelle X(Y=20).
P(X=11/Y=20) = 2/6 = 0,33
P(X=16/Y=20) = 4/6 = 0,67
P(X=21/Y=20) = 0/6 = 0
P(X=26/Y=20) = 0/6 = 0
P(X=31/Y=20) = 0/6 = 0
P(X=36/Y=20) = 0/6 = 0
Espérance conditionnelle M = 11*0,33 + 16*0,67 + 21*0 + 26*0 + 31*0 + 36*0 = 14,33
Variance conditionnelle D = 11 2 *0,33 + 16 2 *0,67 + 21 2 *0 + 26 2 *0 + 31 2 *0 + 36 2 *0 - 14,33 2 = 5,56
Loi de distribution conditionnelle X(Y=30).
P(X=11/Y=30) = 0/9 = 0
P(X=16/Y=30) = 6/9 = 0,67
P(X=21/Y=30) = 3/9 = 0,33
P(X=26/Y=30) = 0/9 = 0
P(X=31/Y=30) = 0/9 = 0
P(X=36/Y=30) = 0/9 = 0
Espérance conditionnelle M = 11*0 + 16*0,67 + 21*0,33 + 26*0 + 31*0 + 36*0 = 17,67
Variance conditionnelle D = 11 2 *0 + 16 2 *0,67 + 21 2 *0,33 + 26 2 *0 + 31 2 *0 + 36 2 *0 - 17,67 2 = 5,56
Loi de distribution conditionnelle X(Y=40).
P(X=11/Y=40) = 0/55 = 0
P(X=16/Y=40) = 0/55 = 0
P(X=21/Y=40) = 6/55 = 0,11
P(X=26/Y=40) = 45/55 = 0,82
P(X=31/Y=40) = 4/55 = 0,0727
P(X=36/Y=40) = 0/55 = 0
Espérance conditionnelle M = 11*0 + 16*0 + 21*0,11 + 26*0,82 + 31*0,0727 + 36*0 = 25,82
Écart conditionnel D = 11 2 *0 + 16 2 *0 + 21 2 *0,11 + 26 2 *0,82 + 31 2 *0,0727 + 36 2 *0 - 25,82 2 = 4,51
Loi de distribution conditionnelle X(Y=50).
P(X=11/Y=50) = 0/16 = 0
P(X=16/Y=50) = 0/16 = 0
P(X=21/Y=50) = 2/16 = 0,13
P(X=26/Y=50) = 8/16 = 0,5
P(X=31/Y=50) = 6/16 = 0,38
P(X=36/Y=50) = 0/16 = 0
Espérance conditionnelle M = 11*0 + 16*0 + 21*0,13 + 26*0,5 + 31*0,38 + 36*0 = 27,25
Écart conditionnel D = 11 2 *0 + 16 2 *0 + 21 2 *0,13 + 26 2 *0,5 + 31 2 *0,38 + 36 2 *0 - 27,25 2 = 10,94
Loi de distribution conditionnelle X(Y=60).
P(X=11/Y=60) = 0/14 = 0
P(X=16/Y=60) = 0/14 = 0
P(X=21/Y=60) = 0/14 = 0
P(X=26/Y=60) = 4/14 = 0,29
P(X=31/Y=60) = 7/14 = 0,5
P(X=36/Y=60) = 3/14 = 0,21
Espérance conditionnelle M = 11*0 + 16*0 + 21*0 + 26*0,29 + 31*0,5 + 36*0,21 = 30,64
Écart conditionnel D = 11 2 *0 + 16 2 *0 + 21 2 *0 + 26 2 *0,29 + 31 2 *0,5 + 36 2 *0,21 - 30,64 2 = 12,37
3. Loi de distribution conditionnelle Y.
Loi de distribution conditionnelle Y(X=11).
P(Y=20/X=11) = 2/2 = 1
P(Y=30/X=11) = 0/2 = 0
P(Y=40/X=11) = 0/2 = 0
P(Y=50/X=11) = 0/2 = 0
P(Y=60/X=11) = 0/2 = 0
Espérance conditionnelle M = 20*1 + 30*0 + 40*0 + 50*0 + 60*0 = 20
Variance conditionnelle D = 20 2 *1 + 30 2 *0 + 40 2 *0 + 50 2 *0 + 60 2 *0 - 20 2 = 0
Loi de distribution conditionnelle Y(X=16).
P(Y=20/X=16) = 4/10 = 0,4
P(Y=30/X=16) = 6/10 = 0,6
P(Y=40/X=16) = 0/10 = 0
P(Y=50/X=16) = 0/10 = 0
P(Y=60/X=16) = 0/10 = 0
Espérance conditionnelle M = 20*0,4 + 30*0,6 + 40*0 + 50*0 + 60*0 = 26
Écart conditionnel D = 20 2 *0,4 + 30 2 *0,6 + 40 2 *0 + 50 2 *0 + 60 2 *0 - 26 2 = 24
Loi de distribution conditionnelle Y(X=21).
P(Y=20/X=21) = 0/11 = 0
P(Y=30/X=21) = 3/11 = 0,27
P(Y=40/X=21) = 6/11 = 0,55
P(Y=50/X=21) = 2/11 = 0,18
P(Y=60/X=21) = 0/11 = 0
Espérance conditionnelle M = 20*0 + 30*0,27 + 40*0,55 + 50*0,18 + 60*0 = 39,09
Écart conditionnel D = 20 2 *0 + 30 2 *0,27 + 40 2 *0,55 + 50 2 *0,18 + 60 2 *0 - 39,09 2 = 44,63
Loi de distribution conditionnelle Y(X=26).
P(Y=20/X=26) = 0/57 = 0
P(Y=30/X=26) = 0/57 = 0
P(Y=40/X=26) = 45/57 = 0,79
P(Y=50/X=26) = 8/57 = 0,14
P(Y=60/X=26) = 4/57 = 0,0702
Espérance conditionnelle M = 20*0 + 30*0 + 40*0,79 + 50*0,14 + 60*0,0702 = 42,81
Écart conditionnel D = 20 2 *0 + 30 2 *0 + 40 2 *0,79 + 50 2 *0,14 + 60 2 *0,0702 - 42,81 2 = 34,23
Loi de distribution conditionnelle Y(X=31).
P(Y=20/X=31) = 0/17 = 0
P(Y=30/X=31) = 0/17 = 0
P(Y=40/X=31) = 4/17 = 0,24
P(Y=50/X=31) = 6/17 = 0,35
P(Y=60/X=31) = 7/17 = 0,41
Espérance conditionnelle M = 20*0 + 30*0 + 40*0,24 + 50*0,35 + 60*0,41 = 51,76
Écart conditionnel D = 20 2 *0 + 30 2 *0 + 40 2 *0,24 + 50 2 *0,35 + 60 2 *0,41 - 51,76 2 = 61,59
Loi de distribution conditionnelle Y(X=36).
P(Y=20/X=36) = 0/3 = 0
P(Y=30/X=36) = 0/3 = 0
P(Y=40/X=36) = 0/3 = 0
P(Y=50/X=36) = 0/3 = 0
P(Y=60/X=36) = 3/3 = 1
Espérance conditionnelle M = 20*0 + 30*0 + 40*0 + 50*0 + 60*1 = 60
Variance conditionnelle D = 20 2 *0 + 30 2 *0 + 40 2 *0 + 50 2 *0 + 60 2 *1 - 60 2 = 0
covariance.
cov(X,Y) = M - M[X] M[Y]
cov(X,Y) = (20 11 2 + 20 16 4 + 30 16 6 + 30 21 3 + 40 21 6 + 50 21 2 + 40 26 45 + 50 26 8 + 60 26 4 + 40 31 4 + 50 31 6 + 60 31 7 + 60 36 3)/100 - 25,3 42,3 = 38,11
Si les variables aléatoires sont indépendantes, alors leur covariance est nulle. Dans notre cas cov(X,Y) ≠ 0.
Coefficient de corrélation.


L'équation de régression linéaire de y à x est :

L'équation de régression linéaire de x à y est :

Trouver les caractéristiques numériques nécessaires.
Échantillon signifie :
x = (20(2 + 4) + 30(6 + 3) + 40(6 + 45 + 4) + 50(2 + 8 + 6) + 60(4 + 7 + 3))/100 = 42,3
y = (20(2 + 4) + 30(6 + 3) + 40(6 + 45 + 4) + 50(2 + 8 + 6) + 60(4 + 7 + 3))/100 = 25,3
dispersions :
σ 2 x = (20 2 (2 + 4) + 30 2 (6 + 3) + 40 2 (6 + 45 + 4) + 50 2 (2 + 8 + 6) + 60 2 (4 + 7 + 3) )/100 - 42,3 2 = 99,71
σ 2 y = (11 2 (2) + 16 2 (4 + 6) + 21 2 (3 + 6 + 2) + 26 2 (45 + 8 + 4) + 31 2 (4 + 6 + 7) + 36 2 (3))/100 - 25,3 2 = 24,01
Où trouve-t-on les écarts-types :
σx = 9,99 et σy = 4,9
et covariance :
Cov(x,y) = (20 11 2 + 20 16 4 + 30 16 6 + 30 21 3 + 40 21 6 + 50 21 2 + 40 26 45 + 50 26 8 + 60 26 4 + 40 31 4 + 50 31 6 + 60 31 7 + 60 36 3)/100 - 42,3 25,3 = 38,11
Définissons le coefficient de corrélation :


Écrivons les équations des droites de régression y(x) :

et en calculant, on obtient :
yx = 0,38x + 9,14
Écrivons les équations des droites de régression x(y) :

et en calculant, on obtient :
x y = 1,59 y + 2,15
Si nous construisons les points définis par le tableau et les droites de régression, nous verrons que les deux droites passent par le point de coordonnées (42,3 ; 25,3) et que les points sont situés à proximité des droites de régression.
Signification du coefficient de corrélation.

D'après la table de Student avec seuil de signification α=0,05 et degrés de liberté k=100-m-1 = 98 on trouve tcrit :
tcrit (n-m-1 ;α/2) = (98 ;0,025) = 1,984
où m = 1 est le nombre de variables explicatives.
Si t obs > t est critique, alors la valeur obtenue du coefficient de corrélation est reconnue comme significative (l'hypothèse nulle affirmant que le coefficient de corrélation est égal à zéro est rejetée).
Puisque t obl > t crit, nous rejetons l'hypothèse que le coefficient de corrélation est égal à 0. En d'autres termes, le coefficient de corrélation est statistiquement significatif.

Exercer. Le nombre de résultats de paires de valeurs de variables aléatoires X et Y dans les intervalles correspondants est indiqué dans le tableau. À partir de ces données, trouvez le coefficient de corrélation d'échantillon et les équations d'échantillon des droites de régression Y sur X et X sur Y .
Décision

Exemple. La distribution de probabilité d'une variable aléatoire bidimensionnelle (X, Y) est donnée par un tableau. Trouver les lois de distribution des grandeurs composantes X, Y et le coefficient de corrélation p(X, Y).
Télécharger la solution

Exercer. Une valeur discrète bidimensionnelle (X, Y) est donnée par une loi de distribution. Trouver les lois de distribution des composantes X et Y, la covariance et le coefficient de corrélation.

Définition 2.7. est une paire de nombres aléatoires (X, Y), ou un point sur le plan de coordonnées (Fig. 2.11).

Riz. 2.11.

Une variable aléatoire bidimensionnelle est un cas particulier de variable aléatoire multidimensionnelle, ou vecteur aléatoire.

Définition 2.8. Vecteur aléatoire - est-ce une fonction aléatoire ?,(/) avec un ensemble fini de valeurs d'arguments possibles t, dont la valeur pour toute valeur t est une variable aléatoire.

Une variable aléatoire bidimensionnelle est dite continue si ses coordonnées sont continues, et discrète si ses coordonnées sont discrètes.

Établir la loi de distribution de variables aléatoires bidimensionnelles revient à établir une correspondance entre ses valeurs possibles et la probabilité de ces valeurs. Selon les modes de réglage, les variables aléatoires sont divisées en continues et discrètes, bien qu'il existe des moyens généraux de définir la loi de distribution de tout RV.

Variable aléatoire bidimensionnelle discrète

Une variable aléatoire bidimensionnelle discrète est spécifiée à l'aide d'un tableau de distribution (tableau 2.1).

Tableau 2.1

Tableau de répartition (répartition conjointe) CB ( X, U)

Les éléments du tableau sont définis par la formule

Propriétés de l'élément du tableau de répartition :

La distribution sur chaque coordonnée est appelée unidimensionnel ou alors marginal:

R 1> = P(X =.d,) - distribution marginale de SW X;

p^2) = P(Y= y,)- distribution marginale de SV U.

Communication de la distribution conjointe de CB X et Y, donné par l'ensemble des probabilités [p () ), je = 1,..., New Jersey = 1,..., t(table de distribution) et distribution marginale.


De même pour SV U p-2)=X p, g

Problème 2.14. Donné:

Variable aléatoire 2D continue

/(X, y)dxdy- élément de probabilité pour une variable aléatoire bidimensionnelle (X, Y) - probabilité de rencontrer une variable aléatoire (X, Y) dans un rectangle à côtés cbc, dyà dx, dy -* 0:

f(x, y) - densité de distribution variable aléatoire bidimensionnelle (X, Y). Tâche /(x, y) nous donnons des informations complètes sur la distribution d'une variable aléatoire bidimensionnelle.

Les distributions marginales sont spécifiées comme suit : pour X - par la densité de distribution de CB X/,(x) ; sur Oui- Densité de distribution SV f>(y).

Définition de la loi de distribution d'une variable aléatoire bidimensionnelle par la fonction de distribution

Une manière universelle de spécifier la loi de distribution pour une variable aléatoire bidimensionnelle discrète ou continue est la fonction de distribution F(x, y).

Définition 2.9. Fonction de répartition F(x, y)- probabilité d'occurrence conjointe d'événements (Xy), c'est-à-dire F(x0,y n) = = P(X y), projetés sur le plan de coordonnées, tombent dans un quadrant infini dont le sommet est au point M(x 0, tu je)(dans la zone ombrée de la Fig. 2.12).

Riz. 2.12. Illustration de la fonction de répartition F( x, y)

Propriétés de la fonction F(x, y)

  • 1) 0 1;
  • 2) F(-oo,-oo) = F(x,-oo) = F(-oo, y) = 0; F( oo, oo) = 1 ;
  • 3) F(x, y)- non décroissant dans chaque argument ;
  • 4) F(x, y) - continu à gauche et en bas ;
  • 5) cohérence des distributions :

F(x, X : F(x, oo) = F,(x); F(y, oo) - distribution marginale sur O F( oh, y) = F2 (y). Lien /(x, y) avec F(x, y):

Relation entre la densité des joints et la densité marginale. Dana f(x, y). On obtient les densités de distribution marginale f(x),f 2 (y)".


Le cas des coordonnées indépendantes d'une variable aléatoire bidimensionnelle

Définition 2.10. SW X et Yindépendant(nc) si des événements associés à chacun de ces RV sont indépendants. De la définition de nc CB, il s'ensuit :

  • 1 )Pij = p X) pf
  • 2 )F(x,y) = F l (x)F 2 (y).

Il s'avère que pour les SW indépendants X et Oui terminé et

3 )f(x,y) = J(x)f,(y).

Montrons que pour des SW indépendants X et Y2) 3). Preuve, a) Soit 2), c'est-à-dire,

dans le même temps F(x,y) = f J f(u,v)dudv, d'où il suit 3);

b) laissez 3 maintenant tenir, puis


ceux. vrai 2).

Considérons les tâches.

Problème 2.15. La répartition est donnée par le tableau suivant :

Nous construisons des distributions marginales :

On a P(X = 3, U = 4) = 0,17 * P(X = 3) P (Y \u003d 4) \u003d 0,1485 => => SV X et personnes à charge.

Fonction de répartition :


Problème 2.16. La répartition est donnée par le tableau suivant :

On a P tl = 0,2 0,3 = 0,06 ; P 12 \u003d 0,2? 0,7 = 0,14 ; P2l = 0,8 ? 0,3 = = 0,24; R 22 - 0,8 0,7 = 0,56 => SW X et Oui nz.

Problème 2.17. Dana /(x, y) = 1/ère exp| -0.5(d "+ 2xy + 5d/ 2)]. Trouver Oh) et /Ay)-

Décision

(calculez vous-même).