Δισδιάστατο τυχαίο. 2D τυχαία μεταβλητή

Ένα διατεταγμένο ζεύγος (X , Y) τυχαίων μεταβλητών X και Y ονομάζεται δισδιάστατη τυχαία μεταβλητή ή τυχαίο διάνυσμα ενός δισδιάστατου χώρου. Μια δισδιάστατη τυχαία μεταβλητή (X,Y) ονομάζεται επίσης σύστημα τυχαίων μεταβλητών X και Y. Το σύνολο όλων των πιθανών τιμών μιας διακριτής τυχαίας μεταβλητής με τις πιθανότητές τους ονομάζεται νόμος κατανομής αυτής της τυχαίας μεταβλητής. Μια διακριτή δισδιάστατη τυχαία μεταβλητή (X, Y) θεωρείται δεδομένη εάν είναι γνωστός ο νόμος κατανομής της:

P(X=x i, Y=y j) = p ij , i=1,2...,n, j=1,2...,m

Ανάθεση υπηρεσίας. Χρησιμοποιώντας την υπηρεσία, σύμφωνα με έναν δεδομένο νόμο διανομής, μπορείτε να βρείτε:

  • σειρές διανομής X και Y, μαθηματική προσδοκία M[X], M[Y], διακύμανση D[X], D[Y];
  • συνδιακύμανση cov(x,y), συντελεστής συσχέτισης r x,y, σειρά κατανομής υπό όρους X, προσδοκία υπό όρους M;
Επιπρόσθετα, δίνεται απάντηση στο ερώτημα «Είναι οι τυχαίες μεταβλητές X και Y εξαρτώμενες;».

Εντολή. Καθορίστε τη διάσταση του πίνακα κατανομής πιθανότητας (αριθμός σειρών και στηλών) και τη μορφή του. Η λύση που προκύπτει αποθηκεύεται σε αρχείο Word.

Παράδειγμα #1. Μια δισδιάστατη διακριτή τυχαία μεταβλητή έχει έναν πίνακα κατανομής:

Υ/Χ 1 2 3 4
10 0 0,11 0,12 0,03
20 0 0,13 0,09 0,02
30 0,02 0,11 0,08 0,01
40 0,03 0,11 0,05 q
Βρείτε την τιμή q και τον συντελεστή συσχέτισης αυτής της τυχαίας μεταβλητής.

Απόφαση. Βρίσκουμε την τιμή q από τη συνθήκη Σp ij = 1
Σp ij = 0,02 + 0,03 + 0,11 + … + 0,03 + 0,02 + 0,01 + q = 1
0,91+q = 1. Όπου q = 0,09

Χρησιμοποιώντας τον τύπο ∑P(x Εγώ, y ι) = σελ Εγώ(j=1..n), βρείτε τη σειρά διανομής X.

Μαθηματική προσδοκία M[Y].
M[y] = 1*0,05 + 2*0,46 + 3*0,34 + 4*0,15 = 2,59
Διασπορά D[Y] = 1 2 *0.05 + 2 2 *0.46 + 3 2 *0.34 + 4 2 *0.15 - 2.59 2 = 0.64
Τυπική απόκλισησ(y) = sqrt(D[Y]) = sqrt(0,64) = 0,801

συνδιακύμανση cov(X,Y) = M - M[X] M[Y] = 2 10 0.11 + 3 10 0.12 + 4 10 0.03 + 2 20 0.13 + 3 20 0.09 + 4 20 0.02 + 1 30 0.12 + 1 30 0.02 + 1. 3 30 0,08 + 4 30 0,01 + 1 40 0,03 + 2 40 0,11 + 3 40 0,05 + 4 40 0,09 - 25,2 2,59 = -0,068
Συντελεστής συσχέτισης rxy = cov(x,y)/σ(x)&sigma(y) = -0,068/(11,531*0,801) = -0,00736

Παράδειγμα 2 . Τα δεδομένα στατιστικής επεξεργασίας πληροφοριών σχετικά με δύο δείκτες Χ και Υ αποτυπώνονται στον πίνακα συσχέτισης. Απαιτείται:

  1. γράψτε τις σειρές κατανομής για τα X και Y και υπολογίστε τις μέσες τιμές δειγμάτων και δείγμα τυπικών αποκλίσεων για αυτές.
  2. Γράψτε τη σειρά κατανομής υπό όρους Y/x και υπολογίστε τους μέσους όρους υπό όρους Y/x.
  3. απεικονίστε γραφικά την εξάρτηση των μέσων υπό όρους Y/x από τις τιμές του X.
  4. Υπολογίστε τον συντελεστή συσχέτισης του δείγματος Y στο X.
  5. γράψτε ένα δείγμα εξίσωσης άμεσης παλινδρόμησης.
  6. αναπαριστούν γεωμετρικά τα δεδομένα του πίνακα συσχέτισης και χτίζουν μια γραμμή παλινδρόμησης.
Απόφαση. Ένα διατεταγμένο ζεύγος (X,Y) τυχαίων μεταβλητών X και Y ονομάζεται δισδιάστατη τυχαία μεταβλητή ή τυχαίο διάνυσμα ενός δισδιάστατου χώρου. Μια δισδιάστατη τυχαία μεταβλητή (Χ, Υ) ονομάζεται επίσης σύστημα τυχαίων μεταβλητών Χ και Υ.
Το σύνολο όλων των πιθανών τιμών μιας διακριτής τυχαίας μεταβλητής με τις πιθανότητές τους ονομάζεται νόμος κατανομής αυτής της τυχαίας μεταβλητής.
Μια διακριτή δισδιάστατη τυχαία μεταβλητή (X,Y) θεωρείται δεδομένη εάν είναι γνωστός ο νόμος κατανομής της:
P(X=x i, Y=y j) = p ij, i=1,2...,n, j=1,2...,m
Χ/Υ20 30 40 50 60
11 2 0 0 0 0
16 4 6 0 0 0
21 0 3 6 2 0
26 0 0 45 8 4
31 0 0 4 6 7
36 0 0 0 0 3
Τα γεγονότα (X=x i, Y=y j) σχηματίζουν μια πλήρη ομάδα γεγονότων, οπότε το άθροισμα όλων των πιθανοτήτων p ij ( i=1,2...,n, j=1,2...,m) που αναφέρεται στον πίνακα ισούται με 1.
1. Εξάρτηση των τυχαίων μεταβλητών X και Y.
Βρείτε τις σειρές διανομής X και Y.
Χρησιμοποιώντας τον τύπο ∑P(x Εγώ, y ι) = σελ Εγώ(j=1..n), βρείτε τη σειρά διανομής X. Μαθηματική προσδοκία M[Y].
M[y] = (20*6 + 30*9 + 40*55 + 50*16 + 60*14)/100 = 42,3
Διασπορά D[Y].
D[Y] = (20 2 *6 + 30 2 *9 + 40 2 *55 + 50 2 *16 + 60 2 *14)/100 - 42,3 2 = 99,71
Τυπική απόκλιση σ(y).

Εφόσον, P(X=11,Y=20) = 2≠2 6, τότε οι τυχαίες μεταβλητές X και Y εξαρτώμενος.
2. Νόμος διανομής υπό όρους Χ.
Νόμος κατανομής υπό όρους X(Y=20).
P(X=11/Y=20) = 2/6 = 0,33
P(X=16/Y=20) = 4/6 = 0,67
P(X=21/Y=20) = 0/6 = 0
P(X=26/Y=20) = 0/6 = 0
P(X=31/Y=20) = 0/6 = 0
P(X=36/Y=20) = 0/6 = 0
Προσδοκία υπό όρους M = 11*0,33 + 16*0,67 + 21*0 + 26*0 + 31*0 + 36*0 = 14,33
Διακύμανση υπό όρους D = 11 2 *0,33 + 16 2 *0,67 + 21 2 *0 + 26 2 *0 + 31 2 *0 + 36 2 *0 - 14,33 2 = 5,56
Νόμος κατανομής υπό όρους X(Y=30).
P(X=11/Y=30) = 0/9 = 0
P(X=16/Y=30) = 6/9 = 0,67
P(X=21/Y=30) = 3/9 = 0,33
P(X=26/Y=30) = 0/9 = 0
P(X=31/Y=30) = 0/9 = 0
P(X=36/Y=30) = 0/9 = 0
Προσδοκία υπό όρους M = 11*0 + 16*0,67 + 21*0,33 + 26*0 + 31*0 + 36*0 = 17,67
Διακύμανση υπό όρους D = 11 2 *0 + 16 2 *0,67 + 21 2 *0,33 + 26 2 *0 + 31 2 *0 + 36 2 *0 - 17,67 2 = 5,56
Νόμος κατανομής υπό όρους X(Y=40).
P(X=11/Y=40) = 0/55 = 0
P(X=16/Y=40) = 0/55 = 0
P(X=21/Y=40) = 6/55 = 0,11
P(X=26/Y=40) = 45/55 = 0,82
P(X=31/Y=40) = 4/55 = 0,0727
P(X=36/Y=40) = 0/55 = 0
Προσδοκία υπό όρους M = 11*0 + 16*0 + 21*0,11 + 26*0,82 + 31*0,0727 + 36*0 = 25,82
Διακύμανση υπό όρους D = 11 2 *0 + 16 2 *0 + 21 2 *0,11 + 26 2 *0,82 + 31 2 *0,0727 + 36 2 *0 - 25,82 2 = 4,51
Νόμος κατανομής υπό όρους X(Y=50).
P(X=11/Y=50) = 0/16 = 0
P(X=16/Y=50) = 0/16 = 0
P(X=21/Y=50) = 2/16 = 0,13
P(X=26/Y=50) = 8/16 = 0,5
P(X=31/Y=50) = 6/16 = 0,38
P(X=36/Y=50) = 0/16 = 0
Προσδοκία υπό όρους M = 11*0 + 16*0 + 21*0,13 + 26*0,5 + 31*0,38 + 36*0 = 27,25
Διακύμανση υπό όρους D = 11 2 *0 + 16 2 *0 + 21 2 *0,13 + 26 2 *0,5 + 31 2 *0,38 + 36 2 *0 - 27,25 2 = 10,94
Νόμος κατανομής υπό όρους X(Y=60).
P(X=11/Y=60) = 0/14 = 0
P(X=16/Y=60) = 0/14 = 0
P(X=21/Y=60) = 0/14 = 0
P(X=26/Y=60) = 4/14 = 0,29
P(X=31/Y=60) = 7/14 = 0,5
P(X=36/Y=60) = 3/14 = 0,21
Προσδοκία υπό όρους M = 11*0 + 16*0 + 21*0 + 26*0,29 + 31*0,5 + 36*0,21 = 30,64
Διακύμανση υπό όρους D = 11 2 *0 + 16 2 *0 + 21 2 *0 + 26 2 *0,29 + 31 2 *0,5 + 36 2 *0,21 - 30,64 2 = 12,37
3. Νόμος υπό όρους διανομής Υ.
Νόμος κατανομής υπό όρους Y(X=11).
P(Y=20/X=11) = 2/2 = 1
P(Y=30/X=11) = 0/2 = 0
P(Y=40/X=11) = 0/2 = 0
P(Y=50/X=11) = 0/2 = 0
P(Y=60/X=11) = 0/2 = 0
Προσδοκία υπό όρους M = 20*1 + 30*0 + 40*0 + 50*0 + 60*0 = 20
Διακύμανση υπό όρους D = 20 2 *1 + 30 2 *0 + 40 2 *0 + 50 2 *0 + 60 2 *0 - 20 2 = 0
Νόμος κατανομής υπό όρους Y(X=16).
P(Y=20/X=16) = 4/10 = 0,4
P(Y=30/X=16) = 6/10 = 0,6
P(Y=40/X=16) = 0/10 = 0
P(Y=50/X=16) = 0/10 = 0
P(Y=60/X=16) = 0/10 = 0
Προσδοκία υπό όρους M = 20*0,4 + 30*0,6 + 40*0 + 50*0 + 60*0 = 26
Διακύμανση υπό όρους D = 20 2 *0,4 + 30 2 *0,6 + 40 2 *0 + 50 2 *0 + 60 2 *0 - 26 2 = 24
Νόμος κατανομής υπό όρους Y(X=21).
P(Y=20/X=21) = 0/11 = 0
P(Y=30/X=21) = 3/11 = 0,27
P(Y=40/X=21) = 6/11 = 0,55
P(Y=50/X=21) = 2/11 = 0,18
P(Y=60/X=21) = 0/11 = 0
Προσδοκία υπό όρους M = 20*0 + 30*0,27 + 40*0,55 + 50*0,18 + 60*0 = 39,09
Διακύμανση υπό όρους D = 20 2 *0 + 30 2 *0,27 + 40 2 *0,55 + 50 2 *0,18 + 60 2 *0 - 39,09 2 = 44,63
Νόμος κατανομής υπό όρους Y(X=26).
P(Y=20/X=26) = 0/57 = 0
P(Y=30/X=26) = 0/57 = 0
P(Y=40/X=26) = 45/57 = 0,79
Ρ(Υ=50/Χ=26) = 8/57 = 0,14
P(Y=60/X=26) = 4/57 = 0,0702
Προσδοκία υπό όρους M = 20*0 + 30*0 + 40*0,79 + 50*0,14 + 60*0,0702 = 42,81
Διακύμανση υπό όρους D = 20 2 *0 + 30 2 *0 + 40 2 *0,79 + 50 2 *0,14 + 60 2 *0,0702 - 42,81 2 = 34,23
Νόμος κατανομής υπό όρους Y(X=31).
P(Y=20/X=31) = 0/17 = 0
P(Y=30/X=31) = 0/17 = 0
P(Y=40/X=31) = 4/17 = 0,24
P(Y=50/X=31) = 6/17 = 0,35
P(Y=60/X=31) = 7/17 = 0,41
Προσδοκία υπό όρους M = 20*0 + 30*0 + 40*0,24 + 50*0,35 + 60*0,41 = 51,76
Διακύμανση υπό όρους D = 20 2 *0 + 30 2 *0 + 40 2 *0,24 + 50 2 *0,35 + 60 2 *0,41 - 51,76 2 = 61,59
Νόμος κατανομής υπό όρους Y(X=36).
P(Y=20/X=36) = 0/3 = 0
P(Y=30/X=36) = 0/3 = 0
P(Y=40/X=36) = 0/3 = 0
P(Y=50/X=36) = 0/3 = 0
P(Y=60/X=36) = 3/3 = 1
Προσδοκία υπό όρους M = 20*0 + 30*0 + 40*0 + 50*0 + 60*1 = 60
Διακύμανση υπό όρους D = 20 2 *0 + 30 2 *0 + 40 2 *0 + 50 2 *0 + 60 2 *1 - 60 2 = 0
συνδιακύμανση.
cov(X,Y) = M - M[X] M[Y]
cov(X,Y) = (20 11 2 + 20 16 4 + 30 16 6 + 30 21 3 + 40 21 6 + 50 21 2 + 40 26 45 + 50 26 8 + 60 26 4 + 40 501 6 + 60 31 7 + 60 36 3)/100 - 25,3 42,3 = 38,11
Εάν οι τυχαίες μεταβλητές είναι ανεξάρτητες, τότε η συνδιακύμανσή τους είναι μηδέν. Στην περίπτωσή μας cov(X,Y) ≠ 0.
Συντελεστής συσχέτισης.


Η εξίσωση γραμμικής παλινδρόμησης από το y στο x είναι:

Η εξίσωση γραμμικής παλινδρόμησης από το x στο y είναι:

Βρείτε τα απαραίτητα αριθμητικά χαρακτηριστικά.
Δείγμα σημαίνει:
x = (20(2 + 4) + 30(6 + 3) + 40(6 + 45 + 4) + 50(2 + 8 + 6) + 60(4 + 7 + 3))/100 = 42,3
y = (20(2 + 4) + 30(6 + 3) + 40(6 + 45 + 4) + 50(2 + 8 + 6) + 60(4 + 7 + 3))/100 = 25,3
διασπορές:
σ 2 x = (20 2 (2 + 4) + 30 2 (6 + 3) + 40 2 (6 + 45 + 4) + 50 2 (2 + 8 + 6) + 60 2 (4 + 7 + 3) )/100 - 42,3 2 = 99,71
σ 2 y = (11 2 (2) + 16 2 (4 + 6) + 21 2 (3 + 6 + 2) + 26 2 (45 + 8 + 4) + 31 2 (4 + 6 + 7) + 36 2 (3))/100 - 25,3 2 = 24,01
Πού βρίσκουμε τις τυπικές αποκλίσεις:
σ x = 9,99 και σ y = 4,9
και συνδιακύμανση:
Cov(x,y) = (20 11 2 + 20 16 4 + 30 16 6 + 30 21 3 + 40 21 6 + 50 21 2 + 40 26 45 + 50 26 8 + 60 26 4 + 40 501 6 + 60 31 7 + 60 36 3)/100 - 42,3 25,3 = 38,11
Ας ορίσουμε τον συντελεστή συσχέτισης:


Ας γράψουμε τις εξισώσεις των γραμμών παλινδρόμησης y(x):

και υπολογίζοντας, παίρνουμε:
yx = 0,38x + 9,14
Ας γράψουμε τις εξισώσεις των γραμμών παλινδρόμησης x(y):

και υπολογίζοντας, παίρνουμε:
x y = 1,59 y + 2,15
Αν οικοδομήσουμε τα σημεία που ορίζονται από τον πίνακα και τις ευθείες παλινδρόμησης, θα δούμε ότι και οι δύο ευθείες διέρχονται από το σημείο με συντεταγμένες (42.3; 25.3) και τα σημεία βρίσκονται κοντά στις γραμμές παλινδρόμησης.
Σημασία του συντελεστή συσχέτισης.

Σύμφωνα με τον πίνακα του Student με επίπεδο σημαντικότητας α=0,05 και βαθμούς ελευθερίας k=100-m-1 = 98 βρίσκουμε t crit:
t crit (n-m-1;α/2) = (98;0.025) = 1.984
όπου m = 1 είναι ο αριθμός των επεξηγηματικών μεταβλητών.
Εάν το t obs > t είναι κρίσιμο, τότε η λαμβανόμενη τιμή του συντελεστή συσχέτισης αναγνωρίζεται ως σημαντική (η μηδενική υπόθεση που βεβαιώνει ότι ο συντελεστής συσχέτισης είναι ίσος με μηδέν απορρίπτεται).
Εφόσον t obl > t crit, απορρίπτουμε την υπόθεση ότι ο συντελεστής συσχέτισης είναι ίσος με 0. Με άλλα λόγια, ο συντελεστής συσχέτισης είναι στατιστικά σημαντικός.

Ασκηση. Ο αριθμός των επισκέψεων ζευγών τιμών των τυχαίων μεταβλητών X και Y στα αντίστοιχα διαστήματα δίνεται στον πίνακα. Από αυτά τα δεδομένα, βρείτε τον συντελεστή συσχέτισης του δείγματος και τις δειγματοληπτικές εξισώσεις των ευθειών γραμμών παλινδρόμησης Y στο X και X στο Y .
Απόφαση

Παράδειγμα. Η κατανομή πιθανότητας μιας δισδιάστατης τυχαίας μεταβλητής (Χ, Υ) δίνεται από έναν πίνακα. Να βρείτε τους νόμους κατανομής των συστατικών μεγεθών X, Y και του συντελεστή συσχέτισης p(X, Y).
Λήψη Λύσης

Ασκηση. Μια δισδιάστατη διακριτή τιμή (X, Y) δίνεται από έναν νόμο κατανομής. Βρείτε τους νόμους κατανομής των συνιστωσών X και Y, συνδιακύμανση και συντελεστή συσχέτισης.

Έστω μια δισδιάστατη τυχαία μεταβλητή $(X,Y)$.

Ορισμός 1

Ο νόμος κατανομής μιας δισδιάστατης τυχαίας μεταβλητής $(X,Y)$ είναι το σύνολο των πιθανών ζευγών αριθμών $(x_i,\ y_j)$ (όπου $x_i \epsilon X,\ y_j \epsilon Y$) και τους πιθανότητες $p_(ij)$ .

Τις περισσότερες φορές, ο νόμος κατανομής μιας δισδιάστατης τυχαίας μεταβλητής γράφεται με τη μορφή πίνακα (Πίνακας 1).

Σχήμα 1. Νόμος κατανομής μιας δισδιάστατης τυχαίας μεταβλητής.

Ας θυμηθούμε τώρα θεώρημα για την πρόσθεση πιθανοτήτων ανεξάρτητων γεγονότων.

Θεώρημα 1

Η πιθανότητα του αθροίσματος ενός πεπερασμένου αριθμού ανεξάρτητων γεγονότων $(\ A)_1$, $(\ A)_2$, ... ,$\ (\ A)_n$ υπολογίζεται από τον τύπο:

Χρησιμοποιώντας αυτόν τον τύπο, μπορούμε να λάβουμε νόμους κατανομής για κάθε στοιχείο μιας δισδιάστατης τυχαίας μεταβλητής, δηλαδή:

Από εδώ προκύπτει ότι το άθροισμα όλων των πιθανοτήτων ενός δισδιάστατου συστήματος έχει την εξής μορφή:

Ας εξετάσουμε λεπτομερώς (βήμα προς βήμα) το πρόβλημα που σχετίζεται με την έννοια του νόμου κατανομής μιας δισδιάστατης τυχαίας μεταβλητής.

Παράδειγμα 1

Ο νόμος κατανομής μιας δισδιάστατης τυχαίας μεταβλητής δίνεται από τον ακόλουθο πίνακα:

Σχήμα 2.

Βρείτε τους νόμους κατανομής των τυχαίων μεταβλητών $X,\ Y$, $X+Y$ και ελέγξτε σε κάθε περίπτωση ότι το συνολικό άθροισμα των πιθανοτήτων είναι ίσο με μία.

  1. Ας βρούμε πρώτα την κατανομή της τυχαίας μεταβλητής $X$. Η τυχαία μεταβλητή $X$ μπορεί να πάρει τις τιμές $x_1=2,$ $x_2=3$, $x_3=5$. Για να βρούμε την κατανομή, θα χρησιμοποιήσουμε το Θεώρημα 1.

Ας βρούμε πρώτα το άθροισμα των πιθανοτήτων $x_1$ ως εξής:

Εικόνα 3

Ομοίως, βρίσκουμε $P\left(x_2\right)$ και $P\left(x_3\right)$:

\ \

Εικόνα 4

  1. Ας βρούμε τώρα την κατανομή της τυχαίας μεταβλητής $Y$. Η τυχαία μεταβλητή $Y$ μπορεί να πάρει τις τιμές $x_1=1,$ $x_2=3$, $x_3=4$. Για να βρούμε την κατανομή, θα χρησιμοποιήσουμε το Θεώρημα 1.

Ας βρούμε πρώτα το άθροισμα των πιθανοτήτων $y_1$ ως εξής:

Εικόνα 5

Ομοίως, βρίσκουμε $P\left(y_2\right)$ και $P\left(y_3\right)$:

\ \

Επομένως, ο νόμος κατανομής της ποσότητας $X$ έχει την ακόλουθη μορφή:

Εικόνα 6

Ας ελέγξουμε την εκπλήρωση της ισότητας του συνολικού αθροίσματος των πιθανοτήτων:

  1. Απομένει να βρεθεί ο νόμος κατανομής της τυχαίας μεταβλητής $X+Y$.

Ας το ορίσουμε για ευκολία μέσω $Z$: $Z=X+Y$.

Αρχικά, ας βρούμε ποιες τιμές μπορεί να πάρει αυτή η ποσότητα. Για να γίνει αυτό, θα προσθέσουμε ανά ζεύγος τις τιμές των $X$ και $Y$. Λαμβάνουμε τις ακόλουθες τιμές: 3, 4, 6, 5, 6, 8, 6, 7, 9. Τώρα, απορρίπτοντας τις αντιστοιχισμένες τιμές, παίρνουμε ότι η τυχαία μεταβλητή $X+Y$ μπορεί να πάρει τις τιμές $z_1 =3,\ z_2=4 ,\ z_3=5,\ z_4=6,\ z_5=7,\ z_6=8,\ z_7=9.\ $

Αρχικά, ας βρούμε το $P(z_1)$. Εφόσον η τιμή του $z_1$ είναι απλή, βρίσκεται ως εξής:

Εικόνα 7

Όλες οι πιθανότητες βρίσκονται παρόμοια, εκτός από το $P(z_4)$:

Ας βρούμε τώρα το $P(z_4)$ ως εξής:

Εικόνα 8

Ως εκ τούτου, ο νόμος διανομής για $Z$ έχει την ακόλουθη μορφή:

Εικόνα 9

Ας ελέγξουμε την εκπλήρωση της ισότητας του συνολικού αθροίσματος των πιθανοτήτων:

Ορισμός.Αν δίνονται δύο τυχαίες μεταβλητές στον ίδιο χώρο στοιχειωδών γεγονότων Χκαι Υ,τότε λένε ότι δίνεται δισδιάστατη τυχαία μεταβλητή (X,Y) .

Παράδειγμα.Το μηχάνημα σφραγίζει χαλύβδινα πλακάκια. Ελεγχόμενο μήκος Χκαι πλάτος Υ. − δισδιάστατο ΝΔ.

ΝΔ Χκαι Υέχουν τις δικές τους συναρτήσεις διανομής και άλλα χαρακτηριστικά.

Ορισμός. Η συνάρτηση κατανομής μιας δισδιάστατης τυχαίας μεταβλητής (X, Y) ονομάζεται συνάρτηση.

Ορισμός. Ο νόμος κατανομής μιας διακριτής δισδιάστατης τυχαίας μεταβλητής (X, Υ) ονομάζεται τραπέζι

Για ένα δισδιάστατο διακριτό ΝΔ .

Ιδιότητες :

2) αν , τότε ; αν τότε ;

4) − συνάρτηση κατανομής Χ;

− συνάρτηση κατανομής Υ.

Πιθανότητα να χτυπηθούν οι τιμές του δισδιάστατου SW στο ορθογώνιο:

Ορισμός. 2D τυχαία μεταβλητή (Χ, Υ)που ονομάζεται συνεχής αν η συνάρτηση κατανομής του είναι συνεχής και έχει παντού (με πιθανή εξαίρεση έναν πεπερασμένο αριθμό καμπυλών) μια συνεχή μικτή μερική παράγωγο 2ης τάξης .

Ορισμός. Η πυκνότητα της κοινής κατανομής πιθανότητας του δισδιάστατου συνεχούς ΝΔ ονομάζεται συνάρτηση.

Τότε προφανώς .

Παράδειγμα 1Το δισδιάστατο συνεχές SW δίνεται από τη συνάρτηση κατανομής

Τότε η πυκνότητα κατανομής έχει τη μορφή

Παράδειγμα 2Το δισδιάστατο συνεχές SW δίνεται από την πυκνότητα κατανομής

Ας βρούμε τη συνάρτηση διανομής του:

Ιδιότητες :

3) για οποιαδήποτε περιοχή.

Αφήστε την πυκνότητα κατανομής της άρθρωσης να είναι γνωστή. Τότε η πυκνότητα κατανομής καθενός από τα συστατικά του δισδιάστατου SW βρίσκεται ως εξής:

Παράδειγμα 2 (συνέχεια).

Οι πυκνότητες κατανομής των δισδιάστατων στοιχείων SW ονομάζονται από ορισμένους συγγραφείς οριακόςπυκνότητες κατανομής πιθανότητας .

Οι υπό όρους νόμοι κατανομής των στοιχείων του συστήματος διακριτών RV.

Υπό όρους πιθανότητα , όπου .

Νόμος υπό όρους κατανομής του εξαρτήματος Χστο:

Χ
R

Ομοίως για , όπου .

Ας φτιάξουμε νόμο διανομής υπό όρους Χστο Υ= 2.

Στη συνέχεια ο νόμος της υπό όρους διανομής

Χ -1
R

Ορισμός. Η υπό όρους πυκνότητα κατανομής της συνιστώσας Χ σε μια δεδομένη τιμή Υ=υπου ονομάζεται .

Ομοίως: .

Ορισμός. υποθετικός μαθηματικός αναμονή για διακριτό SW Y at ονομάζεται , όπου − βλέπε παραπάνω.

Ως εκ τούτου, .

Για συνεχήςΝΔ Υ .

Προφανώς είναι συνάρτηση του επιχειρήματος Χ. Αυτή η συνάρτηση καλείται συνάρτηση παλινδρόμησης Υ στο Χ .

Ομοίως ορίζεται συνάρτηση παλινδρόμησης x-on-y : .

Θεώρημα 5. (Σχετικά με τη συνάρτηση κατανομής των ανεξάρτητων RV)

ΝΔ Χκαι Υ

Συνέπεια.Συνεχής ΝΔ Χκαι Υείναι ανεξάρτητες αν και μόνο αν .

Στο παράδειγμα 1 με . Επομένως, η ΝΔ Χκαι Υανεξάρτητος.

Αριθμητικά χαρακτηριστικά των συνιστωσών μιας δισδιάστατης τυχαίας μεταβλητής

Για διακριτή CB:

Για συνεχή ΝΔ: .

Η διασπορά και η τυπική απόκλιση για όλα τα SW καθορίζονται από τους ίδιους τύπους που είναι γνωστοί σε εμάς:

Ορισμός.Το σημείο λέγεται κέντρο διασποράς δισδιάστατο ΝΔ.

Ορισμός. Συνδιακύμανση (στιγμή συσχέτισης) ΝΕ λέγεται

Για διακριτή SW: .

Για συνεχή ΝΔ: .

Τύπος υπολογισμού: .

Για ανεξάρτητους ΚΤ.

Η ταλαιπωρία του χαρακτηριστικού είναι η διάστασή του (το τετράγωνο της μονάδας μέτρησης των συστατικών). Η παρακάτω ποσότητα είναι απαλλαγμένη από αυτό το μειονέκτημα.

Ορισμός. Συντελεστής συσχέτισης ΝΔ Χκαι Υπου ονομάζεται

Για ανεξάρτητους ΚΤ.

Για οποιοδήποτε ζεύγος ΝΔ . Είναι γνωστό ότι αν και μόνο αν , που .

Ορισμός.ΝΔ Χκαι Υπου ονομάζεται ασύνδετο , αν .

Σχέση συσχέτισης και εξάρτησης ΝΔ:

− εάν CB Χκαι Υσυσχετίζονται, δηλ. , τότε είναι εξαρτημένοι? το αντίστροφο δεν ισχύει?

− εάν CB Χκαι Υανεξάρτητο λοιπόν ; το αντίθετο δεν ισχύει.

Παρατήρηση 1.Αν ΝΔ Χκαι Υκατανέμεται σύμφωνα με τον κανονικό νόμο και , τότε είναι ανεξάρτητοι.

Παρατήρηση 2.Πρακτική αξία ως μέτρο εξάρτησης δικαιολογείται μόνο όταν η κοινή κατανομή του ζεύγους είναι κανονική ή περίπου κανονική. Για αυθαίρετα ΝΔ Χκαι Υμπορείς να καταλήξεις σε λάθος συμπέρασμα, δηλ. μπορεί ακόμη και όταν Χκαι Υσυνδέονται με μια αυστηρή λειτουργική σχέση.

Παρατήρηση 3.Στη μαθηματική στατιστική, συσχέτιση είναι μια πιθανολογική (στατιστική) εξάρτηση μεταξύ μεγεθών που, γενικά, δεν έχει αυστηρά λειτουργικό χαρακτήρα. Η εξάρτηση συσχέτισης εμφανίζεται όταν ένα από τα μεγέθη εξαρτάται όχι μόνο από το δεδομένο δεύτερο, αλλά και από έναν αριθμό τυχαίων παραγόντων, ή όταν μεταξύ των συνθηκών από τις οποίες εξαρτάται η μία ή η άλλη ποσότητα, υπάρχουν συνθήκες κοινές και για τις δύο.

Παράδειγμα 4Για τη ΝΔ Χκαι Υαπό το παράδειγμα 3 βρείτε .

Απόφαση.

Παράδειγμα 5Δίνεται η πυκνότητα κοινής κατανομής του δισδιάστατου ΝΔ.

Ένα διατεταγμένο ζεύγος (X , Y) τυχαίων μεταβλητών X και Y ονομάζεται δισδιάστατη τυχαία μεταβλητή ή τυχαίο διάνυσμα ενός δισδιάστατου χώρου. Μια δισδιάστατη τυχαία μεταβλητή (X,Y) ονομάζεται επίσης σύστημα τυχαίων μεταβλητών X και Y. Το σύνολο όλων των πιθανών τιμών μιας διακριτής τυχαίας μεταβλητής με τις πιθανότητές τους ονομάζεται νόμος κατανομής αυτής της τυχαίας μεταβλητής. Μια διακριτή δισδιάστατη τυχαία μεταβλητή (X, Y) θεωρείται δεδομένη εάν είναι γνωστός ο νόμος κατανομής της:

P(X=x i, Y=y j) = p ij , i=1,2...,n, j=1,2...,m

Ανάθεση υπηρεσίας. Χρησιμοποιώντας την υπηρεσία, σύμφωνα με έναν δεδομένο νόμο διανομής, μπορείτε να βρείτε:

  • σειρές διανομής X και Y, μαθηματική προσδοκία M[X], M[Y], διακύμανση D[X], D[Y];
  • συνδιακύμανση cov(x,y), συντελεστής συσχέτισης r x,y, σειρά κατανομής υπό όρους X, προσδοκία υπό όρους M;
Επιπρόσθετα, δίνεται απάντηση στο ερώτημα «Είναι οι τυχαίες μεταβλητές X και Y εξαρτώμενες;».

Εντολή. Καθορίστε τη διάσταση του πίνακα κατανομής πιθανότητας (αριθμός σειρών και στηλών) και τη μορφή του. Η λύση που προκύπτει αποθηκεύεται σε αρχείο Word.

Παράδειγμα #1. Μια δισδιάστατη διακριτή τυχαία μεταβλητή έχει έναν πίνακα κατανομής:

Υ/Χ 1 2 3 4
10 0 0,11 0,12 0,03
20 0 0,13 0,09 0,02
30 0,02 0,11 0,08 0,01
40 0,03 0,11 0,05 q
Βρείτε την τιμή q και τον συντελεστή συσχέτισης αυτής της τυχαίας μεταβλητής.

Απόφαση. Βρίσκουμε την τιμή q από τη συνθήκη Σp ij = 1
Σp ij = 0,02 + 0,03 + 0,11 + … + 0,03 + 0,02 + 0,01 + q = 1
0,91+q = 1. Όπου q = 0,09

Χρησιμοποιώντας τον τύπο ∑P(x Εγώ, y ι) = σελ Εγώ(j=1..n), βρείτε τη σειρά διανομής X.

Μαθηματική προσδοκία M[Y].
M[y] = 1*0,05 + 2*0,46 + 3*0,34 + 4*0,15 = 2,59
Διασπορά D[Y] = 1 2 *0.05 + 2 2 *0.46 + 3 2 *0.34 + 4 2 *0.15 - 2.59 2 = 0.64
Τυπική απόκλισησ(y) = sqrt(D[Y]) = sqrt(0,64) = 0,801

συνδιακύμανση cov(X,Y) = M - M[X] M[Y] = 2 10 0.11 + 3 10 0.12 + 4 10 0.03 + 2 20 0.13 + 3 20 0.09 + 4 20 0.02 + 1 30 0.12 + 1 30 0.02 + 1. 3 30 0,08 + 4 30 0,01 + 1 40 0,03 + 2 40 0,11 + 3 40 0,05 + 4 40 0,09 - 25,2 2,59 = -0,068
Συντελεστής συσχέτισης rxy = cov(x,y)/σ(x)&sigma(y) = -0,068/(11,531*0,801) = -0,00736

Παράδειγμα 2 . Τα δεδομένα στατιστικής επεξεργασίας πληροφοριών σχετικά με δύο δείκτες Χ και Υ αποτυπώνονται στον πίνακα συσχέτισης. Απαιτείται:

  1. γράψτε τις σειρές κατανομής για τα X και Y και υπολογίστε τις μέσες τιμές δειγμάτων και δείγμα τυπικών αποκλίσεων για αυτές.
  2. Γράψτε τη σειρά κατανομής υπό όρους Y/x και υπολογίστε τους μέσους όρους υπό όρους Y/x.
  3. απεικονίστε γραφικά την εξάρτηση των μέσων υπό όρους Y/x από τις τιμές του X.
  4. Υπολογίστε τον συντελεστή συσχέτισης του δείγματος Y στο X.
  5. γράψτε ένα δείγμα εξίσωσης άμεσης παλινδρόμησης.
  6. αναπαριστούν γεωμετρικά τα δεδομένα του πίνακα συσχέτισης και χτίζουν μια γραμμή παλινδρόμησης.
Απόφαση. Ένα διατεταγμένο ζεύγος (X,Y) τυχαίων μεταβλητών X και Y ονομάζεται δισδιάστατη τυχαία μεταβλητή ή τυχαίο διάνυσμα ενός δισδιάστατου χώρου. Μια δισδιάστατη τυχαία μεταβλητή (Χ, Υ) ονομάζεται επίσης σύστημα τυχαίων μεταβλητών Χ και Υ.
Το σύνολο όλων των πιθανών τιμών μιας διακριτής τυχαίας μεταβλητής με τις πιθανότητές τους ονομάζεται νόμος κατανομής αυτής της τυχαίας μεταβλητής.
Μια διακριτή δισδιάστατη τυχαία μεταβλητή (X,Y) θεωρείται δεδομένη εάν είναι γνωστός ο νόμος κατανομής της:
P(X=x i, Y=y j) = p ij, i=1,2...,n, j=1,2...,m
Χ/Υ20 30 40 50 60
11 2 0 0 0 0
16 4 6 0 0 0
21 0 3 6 2 0
26 0 0 45 8 4
31 0 0 4 6 7
36 0 0 0 0 3
Τα γεγονότα (X=x i, Y=y j) σχηματίζουν μια πλήρη ομάδα γεγονότων, οπότε το άθροισμα όλων των πιθανοτήτων p ij ( i=1,2...,n, j=1,2...,m) που αναφέρεται στον πίνακα ισούται με 1.
1. Εξάρτηση των τυχαίων μεταβλητών X και Y.
Βρείτε τις σειρές διανομής X και Y.
Χρησιμοποιώντας τον τύπο ∑P(x Εγώ, y ι) = σελ Εγώ(j=1..n), βρείτε τη σειρά διανομής X. Μαθηματική προσδοκία M[Y].
M[y] = (20*6 + 30*9 + 40*55 + 50*16 + 60*14)/100 = 42,3
Διασπορά D[Y].
D[Y] = (20 2 *6 + 30 2 *9 + 40 2 *55 + 50 2 *16 + 60 2 *14)/100 - 42,3 2 = 99,71
Τυπική απόκλιση σ(y).

Εφόσον, P(X=11,Y=20) = 2≠2 6, τότε οι τυχαίες μεταβλητές X και Y εξαρτώμενος.
2. Νόμος διανομής υπό όρους Χ.
Νόμος κατανομής υπό όρους X(Y=20).
P(X=11/Y=20) = 2/6 = 0,33
P(X=16/Y=20) = 4/6 = 0,67
P(X=21/Y=20) = 0/6 = 0
P(X=26/Y=20) = 0/6 = 0
P(X=31/Y=20) = 0/6 = 0
P(X=36/Y=20) = 0/6 = 0
Προσδοκία υπό όρους M = 11*0,33 + 16*0,67 + 21*0 + 26*0 + 31*0 + 36*0 = 14,33
Διακύμανση υπό όρους D = 11 2 *0,33 + 16 2 *0,67 + 21 2 *0 + 26 2 *0 + 31 2 *0 + 36 2 *0 - 14,33 2 = 5,56
Νόμος κατανομής υπό όρους X(Y=30).
P(X=11/Y=30) = 0/9 = 0
P(X=16/Y=30) = 6/9 = 0,67
P(X=21/Y=30) = 3/9 = 0,33
P(X=26/Y=30) = 0/9 = 0
P(X=31/Y=30) = 0/9 = 0
P(X=36/Y=30) = 0/9 = 0
Προσδοκία υπό όρους M = 11*0 + 16*0,67 + 21*0,33 + 26*0 + 31*0 + 36*0 = 17,67
Διακύμανση υπό όρους D = 11 2 *0 + 16 2 *0,67 + 21 2 *0,33 + 26 2 *0 + 31 2 *0 + 36 2 *0 - 17,67 2 = 5,56
Νόμος κατανομής υπό όρους X(Y=40).
P(X=11/Y=40) = 0/55 = 0
P(X=16/Y=40) = 0/55 = 0
P(X=21/Y=40) = 6/55 = 0,11
P(X=26/Y=40) = 45/55 = 0,82
P(X=31/Y=40) = 4/55 = 0,0727
P(X=36/Y=40) = 0/55 = 0
Προσδοκία υπό όρους M = 11*0 + 16*0 + 21*0,11 + 26*0,82 + 31*0,0727 + 36*0 = 25,82
Διακύμανση υπό όρους D = 11 2 *0 + 16 2 *0 + 21 2 *0,11 + 26 2 *0,82 + 31 2 *0,0727 + 36 2 *0 - 25,82 2 = 4,51
Νόμος κατανομής υπό όρους X(Y=50).
P(X=11/Y=50) = 0/16 = 0
P(X=16/Y=50) = 0/16 = 0
P(X=21/Y=50) = 2/16 = 0,13
P(X=26/Y=50) = 8/16 = 0,5
P(X=31/Y=50) = 6/16 = 0,38
P(X=36/Y=50) = 0/16 = 0
Προσδοκία υπό όρους M = 11*0 + 16*0 + 21*0,13 + 26*0,5 + 31*0,38 + 36*0 = 27,25
Διακύμανση υπό όρους D = 11 2 *0 + 16 2 *0 + 21 2 *0,13 + 26 2 *0,5 + 31 2 *0,38 + 36 2 *0 - 27,25 2 = 10,94
Νόμος κατανομής υπό όρους X(Y=60).
P(X=11/Y=60) = 0/14 = 0
P(X=16/Y=60) = 0/14 = 0
P(X=21/Y=60) = 0/14 = 0
P(X=26/Y=60) = 4/14 = 0,29
P(X=31/Y=60) = 7/14 = 0,5
P(X=36/Y=60) = 3/14 = 0,21
Προσδοκία υπό όρους M = 11*0 + 16*0 + 21*0 + 26*0,29 + 31*0,5 + 36*0,21 = 30,64
Διακύμανση υπό όρους D = 11 2 *0 + 16 2 *0 + 21 2 *0 + 26 2 *0,29 + 31 2 *0,5 + 36 2 *0,21 - 30,64 2 = 12,37
3. Νόμος υπό όρους διανομής Υ.
Νόμος κατανομής υπό όρους Y(X=11).
P(Y=20/X=11) = 2/2 = 1
P(Y=30/X=11) = 0/2 = 0
P(Y=40/X=11) = 0/2 = 0
P(Y=50/X=11) = 0/2 = 0
P(Y=60/X=11) = 0/2 = 0
Προσδοκία υπό όρους M = 20*1 + 30*0 + 40*0 + 50*0 + 60*0 = 20
Διακύμανση υπό όρους D = 20 2 *1 + 30 2 *0 + 40 2 *0 + 50 2 *0 + 60 2 *0 - 20 2 = 0
Νόμος κατανομής υπό όρους Y(X=16).
P(Y=20/X=16) = 4/10 = 0,4
P(Y=30/X=16) = 6/10 = 0,6
P(Y=40/X=16) = 0/10 = 0
P(Y=50/X=16) = 0/10 = 0
P(Y=60/X=16) = 0/10 = 0
Προσδοκία υπό όρους M = 20*0,4 + 30*0,6 + 40*0 + 50*0 + 60*0 = 26
Διακύμανση υπό όρους D = 20 2 *0,4 + 30 2 *0,6 + 40 2 *0 + 50 2 *0 + 60 2 *0 - 26 2 = 24
Νόμος κατανομής υπό όρους Y(X=21).
P(Y=20/X=21) = 0/11 = 0
P(Y=30/X=21) = 3/11 = 0,27
P(Y=40/X=21) = 6/11 = 0,55
P(Y=50/X=21) = 2/11 = 0,18
P(Y=60/X=21) = 0/11 = 0
Προσδοκία υπό όρους M = 20*0 + 30*0,27 + 40*0,55 + 50*0,18 + 60*0 = 39,09
Διακύμανση υπό όρους D = 20 2 *0 + 30 2 *0,27 + 40 2 *0,55 + 50 2 *0,18 + 60 2 *0 - 39,09 2 = 44,63
Νόμος κατανομής υπό όρους Y(X=26).
P(Y=20/X=26) = 0/57 = 0
P(Y=30/X=26) = 0/57 = 0
P(Y=40/X=26) = 45/57 = 0,79
Ρ(Υ=50/Χ=26) = 8/57 = 0,14
P(Y=60/X=26) = 4/57 = 0,0702
Προσδοκία υπό όρους M = 20*0 + 30*0 + 40*0,79 + 50*0,14 + 60*0,0702 = 42,81
Διακύμανση υπό όρους D = 20 2 *0 + 30 2 *0 + 40 2 *0,79 + 50 2 *0,14 + 60 2 *0,0702 - 42,81 2 = 34,23
Νόμος κατανομής υπό όρους Y(X=31).
P(Y=20/X=31) = 0/17 = 0
P(Y=30/X=31) = 0/17 = 0
P(Y=40/X=31) = 4/17 = 0,24
P(Y=50/X=31) = 6/17 = 0,35
P(Y=60/X=31) = 7/17 = 0,41
Προσδοκία υπό όρους M = 20*0 + 30*0 + 40*0,24 + 50*0,35 + 60*0,41 = 51,76
Διακύμανση υπό όρους D = 20 2 *0 + 30 2 *0 + 40 2 *0,24 + 50 2 *0,35 + 60 2 *0,41 - 51,76 2 = 61,59
Νόμος κατανομής υπό όρους Y(X=36).
P(Y=20/X=36) = 0/3 = 0
P(Y=30/X=36) = 0/3 = 0
P(Y=40/X=36) = 0/3 = 0
P(Y=50/X=36) = 0/3 = 0
P(Y=60/X=36) = 3/3 = 1
Προσδοκία υπό όρους M = 20*0 + 30*0 + 40*0 + 50*0 + 60*1 = 60
Διακύμανση υπό όρους D = 20 2 *0 + 30 2 *0 + 40 2 *0 + 50 2 *0 + 60 2 *1 - 60 2 = 0
συνδιακύμανση.
cov(X,Y) = M - M[X] M[Y]
cov(X,Y) = (20 11 2 + 20 16 4 + 30 16 6 + 30 21 3 + 40 21 6 + 50 21 2 + 40 26 45 + 50 26 8 + 60 26 4 + 40 501 6 + 60 31 7 + 60 36 3)/100 - 25,3 42,3 = 38,11
Εάν οι τυχαίες μεταβλητές είναι ανεξάρτητες, τότε η συνδιακύμανσή τους είναι μηδέν. Στην περίπτωσή μας cov(X,Y) ≠ 0.
Συντελεστής συσχέτισης.


Η εξίσωση γραμμικής παλινδρόμησης από το y στο x είναι:

Η εξίσωση γραμμικής παλινδρόμησης από το x στο y είναι:

Βρείτε τα απαραίτητα αριθμητικά χαρακτηριστικά.
Δείγμα σημαίνει:
x = (20(2 + 4) + 30(6 + 3) + 40(6 + 45 + 4) + 50(2 + 8 + 6) + 60(4 + 7 + 3))/100 = 42,3
y = (20(2 + 4) + 30(6 + 3) + 40(6 + 45 + 4) + 50(2 + 8 + 6) + 60(4 + 7 + 3))/100 = 25,3
διασπορές:
σ 2 x = (20 2 (2 + 4) + 30 2 (6 + 3) + 40 2 (6 + 45 + 4) + 50 2 (2 + 8 + 6) + 60 2 (4 + 7 + 3) )/100 - 42,3 2 = 99,71
σ 2 y = (11 2 (2) + 16 2 (4 + 6) + 21 2 (3 + 6 + 2) + 26 2 (45 + 8 + 4) + 31 2 (4 + 6 + 7) + 36 2 (3))/100 - 25,3 2 = 24,01
Πού βρίσκουμε τις τυπικές αποκλίσεις:
σ x = 9,99 και σ y = 4,9
και συνδιακύμανση:
Cov(x,y) = (20 11 2 + 20 16 4 + 30 16 6 + 30 21 3 + 40 21 6 + 50 21 2 + 40 26 45 + 50 26 8 + 60 26 4 + 40 501 6 + 60 31 7 + 60 36 3)/100 - 42,3 25,3 = 38,11
Ας ορίσουμε τον συντελεστή συσχέτισης:


Ας γράψουμε τις εξισώσεις των γραμμών παλινδρόμησης y(x):

και υπολογίζοντας, παίρνουμε:
yx = 0,38x + 9,14
Ας γράψουμε τις εξισώσεις των γραμμών παλινδρόμησης x(y):

και υπολογίζοντας, παίρνουμε:
x y = 1,59 y + 2,15
Αν οικοδομήσουμε τα σημεία που ορίζονται από τον πίνακα και τις ευθείες παλινδρόμησης, θα δούμε ότι και οι δύο ευθείες διέρχονται από το σημείο με συντεταγμένες (42.3; 25.3) και τα σημεία βρίσκονται κοντά στις γραμμές παλινδρόμησης.
Σημασία του συντελεστή συσχέτισης.

Σύμφωνα με τον πίνακα του Student με επίπεδο σημαντικότητας α=0,05 και βαθμούς ελευθερίας k=100-m-1 = 98 βρίσκουμε t crit:
t crit (n-m-1;α/2) = (98;0.025) = 1.984
όπου m = 1 είναι ο αριθμός των επεξηγηματικών μεταβλητών.
Εάν το t obs > t είναι κρίσιμο, τότε η λαμβανόμενη τιμή του συντελεστή συσχέτισης αναγνωρίζεται ως σημαντική (η μηδενική υπόθεση που βεβαιώνει ότι ο συντελεστής συσχέτισης είναι ίσος με μηδέν απορρίπτεται).
Εφόσον t obl > t crit, απορρίπτουμε την υπόθεση ότι ο συντελεστής συσχέτισης είναι ίσος με 0. Με άλλα λόγια, ο συντελεστής συσχέτισης είναι στατιστικά σημαντικός.

Ασκηση. Ο αριθμός των επισκέψεων ζευγών τιμών των τυχαίων μεταβλητών X και Y στα αντίστοιχα διαστήματα δίνεται στον πίνακα. Από αυτά τα δεδομένα, βρείτε τον συντελεστή συσχέτισης του δείγματος και τις δειγματοληπτικές εξισώσεις των ευθειών γραμμών παλινδρόμησης Y στο X και X στο Y .
Απόφαση

Παράδειγμα. Η κατανομή πιθανότητας μιας δισδιάστατης τυχαίας μεταβλητής (Χ, Υ) δίνεται από έναν πίνακα. Να βρείτε τους νόμους κατανομής των συστατικών μεγεθών X, Y και του συντελεστή συσχέτισης p(X, Y).
Λήψη Λύσης

Ασκηση. Μια δισδιάστατη διακριτή τιμή (X, Y) δίνεται από έναν νόμο κατανομής. Βρείτε τους νόμους κατανομής των συνιστωσών X και Y, συνδιακύμανση και συντελεστή συσχέτισης.

Ορισμός 2.7. είναι ένα ζεύγος τυχαίων αριθμών (X, Υ),ή ένα σημείο στο επίπεδο συντεταγμένων (Εικ. 2.11).

Ρύζι. 2.11.

Μια δισδιάστατη τυχαία μεταβλητή είναι μια ειδική περίπτωση μιας πολυδιάστατης τυχαίας μεταβλητής ή τυχαίου διανύσματος.

Ορισμός 2.8. Τυχαίο διάνυσμα -είναι μια τυχαία συνάρτηση;,(/) με ένα πεπερασμένο σύνολο πιθανών τιμών ορίσματος t,του οποίου η αξία για οποιαδήποτε αξία tείναι μια τυχαία μεταβλητή.

Μια δισδιάστατη τυχαία μεταβλητή ονομάζεται συνεχής αν οι συντεταγμένες της είναι συνεχείς και διακριτή αν οι συντεταγμένες της είναι διακριτές.

Για να ορίσετε τον νόμο κατανομής των δισδιάστατων τυχαίων μεταβλητών σημαίνει να δημιουργήσετε μια αντιστοιχία μεταξύ των πιθανών τιμών του και της πιθανότητας αυτών των τιμών. Σύμφωνα με τους τρόπους ρύθμισης, οι τυχαίες μεταβλητές χωρίζονται σε συνεχείς και διακριτές, αν και υπάρχουν γενικοί τρόποι για τον καθορισμό του νόμου κατανομής οποιουδήποτε RV.

Διακριτή δισδιάστατη τυχαία μεταβλητή

Μια διακριτή δισδιάστατη τυχαία μεταβλητή καθορίζεται χρησιμοποιώντας έναν πίνακα κατανομής (Πίνακας 2.1).

Πίνακας 2.1

Πίνακας κατανομής (κοινή κατανομή) CB ( Χ, U)

Τα στοιχεία του πίνακα ορίζονται από τον τύπο

Ιδιότητες στοιχείων πίνακα διανομής:

Η κατανομή σε κάθε συντεταγμένη ονομάζεται μονοδιάστατηή οριακός:

R 1> = P(X =.δ,) - οριακή κατανομή ΝΔ Χ;

p^2) = P(Y= y,)- οριακή κατανομή του SV U.

Κοινοποίηση της κοινής διανομής ΚΤ Χκαι Υ, που δίνονται από το σύνολο των πιθανοτήτων [πι = 1,..., n,j = 1,..., t(πίνακας διανομής), και οριακή κατανομή.


Ομοίως για το SV U σελ- 2)= Χ σ, ζ

Πρόβλημα 2.14. Δεδομένος:

Συνεχής 2D τυχαία μεταβλητή

/(Χ, y)dxdy- στοιχείο πιθανότητας για μια δισδιάστατη τυχαία μεταβλητή (X, Y) - πιθανότητα να χτυπηθεί μια τυχαία μεταβλητή (X, Y) σε ένα ορθογώνιο με πλευρές cbc, dyστο dx, δυ -* 0:

f(x, y) - πυκνότητα κατανομήςδισδιάστατη τυχαία μεταβλητή (Χ, Υ). Εργασία /(x, y)δίνουμε πλήρεις πληροφορίες σχετικά με την κατανομή μιας δισδιάστατης τυχαίας μεταβλητής.

Οι οριακές κατανομές καθορίζονται ως εξής: για X - από την πυκνότητα κατανομής του CB X/,(x); επί Υ- Πυκνότητα κατανομής SV f>(y).

Ρύθμιση του νόμου κατανομής μιας δισδιάστατης τυχαίας μεταβλητής από τη συνάρτηση κατανομής

Ένας καθολικός τρόπος για τον καθορισμό του νόμου κατανομής για μια διακριτή ή συνεχή δισδιάστατη τυχαία μεταβλητή είναι η συνάρτηση κατανομής F(x, y).

Ορισμός 2.9. Συνάρτηση κατανομής F(x, y)- πιθανότητα κοινής εμφάνισης γεγονότων (Xy), δηλ. F(x0,yιδ) = = P(X y), ρίχνονται στο επίπεδο συντεταγμένων, πέφτουν σε ένα άπειρο τεταρτημόριο με κορυφή στο σημείο M(x 0, u i)(στη σκιασμένη περιοχή στο Σχ. 2.12).

Ρύζι. 2.12.Απεικόνιση της συνάρτησης κατανομής F( x, y)

Ιδιότητες συνάρτησης F(x, y)

  • 1) 0 1;
  • 2) F(-oo,-οο) = F(x,-oo) = F(-oo, y) = 0; ΦΑ( oo, oo) = 1;
  • 3) F(x, y)- μη φθίνουσα σε κάθε όρισμα.
  • 4) F(x, y) -συνεχής αριστερά και κάτω?
  • 5) συνέπεια των διανομών:

F(x, X: F(x, oo) = F,(x); F(y, oo) - οριακή κατανομή πάνω Y F(ω, y) = F 2 (y).Σύνδεση /(x, y)με F(x, y):

Σχέση μεταξύ πυκνότητας αρμού και οριακής πυκνότητας. Ντάνα f(x, y).Παίρνουμε τις οριακές πυκνότητες κατανομής f(x),f 2 (y)".


Η περίπτωση των ανεξάρτητων συντεταγμένων μιας δισδιάστατης τυχαίας μεταβλητής

Ορισμός 2.10. ΝΔ Χκαι Yindependent(γ) εάν τυχόν συμβάντα που σχετίζονται με καθένα από αυτά τα RV είναι ανεξάρτητα. Από τον ορισμό του nc CB προκύπτει:

  • 1 )Pij = p X) pf
  • 2 )F(x,y) = F l (x)F 2 (y).

Αποδεικνύεται ότι για τις ανεξάρτητες ΝΔ Χκαι Υολοκληρωθεί και

3 )f(x,y) = J(x)f,(y).

Ας το αποδείξουμε για τις ανεξάρτητες ΝΔ Χκαι Υ2) 3). Απόδειξη,α) Έστω 2), δηλ.

Ταυτοχρονα F(x,y) = f J f(u,v)dudv,από όπου προκύπτει 3).

β) ας κρατήσει το 3 τώρα


εκείνοι. αλήθεια 2).

Ας εξετάσουμε τα καθήκοντα.

Πρόβλημα 2.15. Η κατανομή δίνεται από τον παρακάτω πίνακα:

Δημιουργούμε οριακές διανομές:

Παίρνουμε P(X = 3, U = 4) = 0,17 * P(X = 3) P (Y \u003d 4) \u003d 0,1485 => => SV Χκαι Εξαρτημένοι.

Λειτουργία διανομής:


Πρόβλημα 2.16. Η κατανομή δίνεται από τον παρακάτω πίνακα:

Παίρνουμε P tl = 0,2 0,3 = 0,06; P 12 \u003d 0,2? 0,7 = 0,14; P2l = 0,8 ? 0,3 = = 0,24; R 22 - 0,8 0,7 = 0,56 => ΝΔ Χκαι Υ nz.

Πρόβλημα 2.17. Dana /(x, y) = 1/st exp| -0,5(d "+ 2xy + 5δ/ 2)]. Να βρω Ω)και /Ay)-

Απόφαση

(υπολογίστε μόνοι σας).