Двовимірні випадкові. Двовимірна випадкова величина

Упорядкована пара (X, Y) випадкових величин X і Y називається двовимірною випадковою величиною, або випадковим вектором двовимірного простору. Двовимірна випадкова величина (X,Y) називається також системою випадкових величина X і Y. Багато всіх можливих значень дискретної випадкової величини з їх ймовірностями називається законом розподілу цієї випадкової величини. Дискретна двовимірна випадкова величина (X, Y) вважається заданою, якщо відомий її закон розподілу:

P(X=x i , Y=y j) = p ij , i=1,2...,n, j=1,2...,m

Призначення сервісу. За допомогою сервісу за заданим законом розподілу можна знайти:

  • ряди розподілу X та Y, математичне очікування M[X], M[Y], дисперсію D[X], D[Y];
  • коваріацію cov(x,y), коефіцієнт кореляції r x,y, умовний ряд розподілу X, умовне математичне очікування M;
Крім цього, дається відповідь на питання, "чи залежні випадкові величини X та Y?".

Інструкція. Вкажіть розмірність матриці розподілу ймовірностей (кількість рядків та стовпців) та її вигляд. Отримане рішення зберігається у файлі Word.

Приклад №1. Двовимірна дискретна випадкова величина має таблицю розподілу:

Y/X 1 2 3 4
10 0 0,11 0,12 0,03
20 0 0,13 0,09 0,02
30 0,02 0,11 0,08 0,01
40 0,03 0,11 0,05 q
Знайти величину q та коефіцієнт кореляції цієї випадкової величини.

Рішення. Величину q знайдемо із умови Σp ij = 1
Σp ij = 0,02 + 0,03 + 0,11 + … + 0,03 + 0,02 + 0,01 + q = 1
0.91 + q = 1. Звідки q = 0.09

Користуючись формулою ∑P(x i,y j) = p i(j=1..n), знаходимо ряд розподілу X.

Математичне очікування M[Y].
M[y] = 1 * 0.05 + 2 * 0.46 + 3 * 0.34 + 4 * 0.15 = 2.59
Дисперсія D[Y] = 1 2 *0.05 + 2 2 *0.46 + 3 2 *0.34 + 4 2 *0.15 - 2.59 2 = 0.64
Середнє квадратичне відхиленняσ(y) = sqrt(D[Y]) = sqrt(0.64) = 0.801

Коваріація cov(X,Y) = M - M[X]·M[Y] = 2·10·0.11 + 3·10·0.12 + 4·10·0.03 + 2·20·0.13 + 3·20·0.09 + 4 ·20·0.02 + 1·30·0.02 + 2·30·0.11 + 3·30·0.08 + 4·30·0.01 + 1·40·0.03 + 2·40·0.11 + 3·40·0.05 + 4·40 · 0.09 - 25.2 · 2.59 = -0.068
Коефіцієнт кореляції r xy = cov(x,y)/σ(x)&sigma(y) = -0.068/(11.531*0.801) = -0.00736

Приклад 2 . Дані статистичної обробки відомостей щодо двох показників X та Y відображені у кореляційній таблиці. Потрібно:

  1. написати ряди розподілу для X і Y та обчислити для них вибіркові середні та вибіркові середні квадратичні відхилення;
  2. написати умовні ряди розподілу Y/x та обчислити умовні середні Y/x;
  3. зобразити графічно залежність умовних середніх Y/x від значень X;
  4. розрахувати вибірковий коефіцієнт кореляції Y X;
  5. написати вибіркове рівняння прямої регресії;
  6. зобразити геометричні дані кореляційної таблиці та побудувати пряму регресію.
Рішення. Упорядкована пара (X,Y) випадкових величин X і Y називається двовимірною випадковою величиною, або випадковим вектором двовимірного простору. Двовимірна випадкова величина (X,Y) називається також системою випадкових величина X та Y.
Безліч всіх можливих значень дискретної випадкової величини зі своїми ймовірностями називається законом розподілу цієї випадкової величини.
Дискретна двовимірна випадкова величина (X,Y) вважається заданою, якщо відомий її закон розподілу:
P(X=x i , Y=y j) = p ij , i=1,2...,n, j=1,2..,m
X/Y20 30 40 50 60
11 2 0 0 0 0
16 4 6 0 0 0
21 0 3 6 2 0
26 0 0 45 8 4
31 0 0 4 6 7
36 0 0 0 0 3
Події (X=x i , Y=y j) утворюють повну групу подій, тому сума всіх ймовірностей p ij ( i=1,2...,n, j=1,2..,m), зазначених у таблиці, дорівнює 1.
1. Залежність випадкових величин X та Y.
Знаходимо ряди розподілу X та Y.
Користуючись формулою ∑P(x i,y j) = p i(j=1..n), знаходимо ряд розподілу X. Математичне очікування M[Y].
M[y] = (20 * 6 + 30 * 9 + 40 * 55 + 50 * 16 + 60 * 14) / 100 = 42.3
Дисперсія D[Y].
D[Y] = (20 2 *6 + 30 2 *9 + 40 2 *55 + 50 2 *16 + 60 2 *14)/100 - 42.3 2 = 99.71
Середнє квадратичне відхилення σ(y).

Оскільки, P(X=11,Y=20) = 2≠2·6, то випадкові величини X та Y залежні.
2. Умовний закон розподілу X.
Умовний закон розподілу X(Y=20).
P(X=11/Y=20) = 2/6 = 0.33
P(X=16/Y=20) = 4/6 = 0.67
P(X=21/Y=20) = 0/6 = 0
P(X=26/Y=20) = 0/6 = 0
P(X=31/Y=20) = 0/6 = 0
P(X=36/Y=20) = 0/6 = 0
Умовне математичне очікування M = 11 * 0.33 + 16 * 0.67 + 21 * 0 + 26 * 0 + 31 * 0 + 36 * 0 = 14.33
Умовна дисперсія D = 11 2 * 0.33 + 16 2 * 0.67 + 21 2 * 0 + 26 2 * 0 + 31 2 * 0 + 36 2 * 0 - 14.33 2 = 5.56
Умовний закон розподілу X(Y=30).
P(X=11/Y=30) = 0/9 = 0
P(X=16/Y=30) = 6/9 = 0.67
P(X=21/Y=30) = 3/9 = 0.33
P(X=26/Y=30) = 0/9 = 0
P(X=31/Y=30) = 0/9 = 0
P(X=36/Y=30) = 0/9 = 0
Умовне математичне очікування M = 11 * 0 + 16 * 0.67 + 21 * 0.33 + 26 * 0 + 31 * 0 + 36 * 0 = 17.67
Умовна дисперсія D = 11 2 *0 + 16 2 *0.67 + 21 2 *0.33 + 26 2 *0 + 31 2 *0 + 36 2 *0 - 17.67 2 = 5.56
Умовний закон розподілу X(Y=40).
P(X=11/Y=40) = 0/55 = 0
P(X=16/Y=40) = 0/55 = 0
P(X=21/Y=40) = 6/55 = 0.11
P(X=26/Y=40) = 45/55 = 0.82
P(X=31/Y=40) = 4/55 = 0.0727
P(X=36/Y=40) = 0/55 = 0
Умовне математичне очікування M = 11 * 0 + 16 * 0 + 21 * 0.11 + 26 * 0.82 + 31 * 0.0727 + 36 * 0 = 25.82
Умовна дисперсія D = 11 2 *0 + 16 2 *0 + 21 2 *0.11 + 26 2 *0.82 + 31 2 *0.0727 + 36 2 *0 - 25.82 2 = 4.51
Умовний закон розподілу X(Y=50).
P(X=11/Y=50) = 0/16 = 0
P(X=16/Y=50) = 0/16 = 0
P(X=21/Y=50) = 2/16 = 0.13
P(X=26/Y=50) = 8/16 = 0.5
P(X=31/Y=50) = 6/16 = 0.38
P(X=36/Y=50) = 0/16 = 0
Умовне математичне очікування M = 11 * 0 + 16 * 0 + 21 * 0.13 + 26 * 0.5 + 31 * 0.38 + 36 * 0 = 27.25
Умовна дисперсія D = 11 2 *0 + 16 2 *0 + 21 2 *0.13 + 26 2 *0.5 + 31 2 *0.38 + 36 2 *0 - 27.25 2 = 10.94
Умовний закон розподілу X(Y=60).
P(X=11/Y=60) = 0/14 = 0
P(X=16/Y=60) = 0/14 = 0
P(X=21/Y=60) = 0/14 = 0
P(X=26/Y=60) = 4/14 = 0.29
P(X=31/Y=60) = 7/14 = 0.5
P(X=36/Y=60) = 3/14 = 0.21
Умовне математичне очікування M = 11 * 0 + 16 * 0 + 21 * 0 + 26 * 0.29 + 31 * 0.5 + 36 * 0.21 = 30.64
Умовна дисперсія D = 11 2 *0 + 16 2 *0 + 21 2 *0 + 26 2 *0.29 + 31 2 *0.5 + 36 2 *0.21 - 30.64 2 = 12.37
3. Умовний закон розподілу Y.
Умовний закон розподілу Y(X=11).
P(Y=20/X=11) = 2/2 = 1
P(Y=30/X=11) = 0/2 = 0
P(Y=40/X=11) = 0/2 = 0
P(Y=50/X=11) = 0/2 = 0
P(Y=60/X=11) = 0/2 = 0
Умовне математичне очікування M = 20 * 1 + 30 * 0 + 40 * 0 + 50 * 0 + 60 * 0 = 20
Умовна дисперсія D = 20 2 * 1 + 30 2 * 0 + 40 2 * 0 + 50 2 * 0 + 60 2 * 0 - 20 2 = 0
Умовний закон розподілу Y(X=16).
P(Y=20/X=16) = 4/10 = 0.4
P(Y=30/X=16) = 6/10 = 0.6
P(Y=40/X=16) = 0/10 = 0
P(Y=50/X=16) = 0/10 = 0
P(Y=60/X=16) = 0/10 = 0
Умовне математичне очікування M = 20 * 0.4 + 30 * 0.6 + 40 * 0 + 50 * 0 + 60 * 0 = 26
Умовна дисперсія D = 20 2 * 0.4 + 30 2 * 0.6 + 40 2 * 0 + 50 2 * 0 + 60 2 * 0 - 26 2 = 24
Умовний закон розподілу Y(X=21).
P(Y=20/X=21) = 0/11 = 0
P(Y=30/X=21) = 3/11 = 0.27
P(Y=40/X=21) = 6/11 = 0.55
P(Y=50/X=21) = 2/11 = 0.18
P(Y=60/X=21) = 0/11 = 0
Умовне математичне очікування M = 20 * 0 + 30 * 0.27 + 40 * 0.55 + 50 * 0.18 + 60 * 0 = 39.09
Умовна дисперсія D = 20 2 * 0 + 30 2 * 0.27 + 40 2 * 0.55 + 50 2 * 0.18 + 60 2 * 0 - 39.09 2 = 44.63
Умовний закон розподілу Y(X=26).
P(Y=20/X=26) = 0/57 = 0
P(Y=30/X=26) = 0/57 = 0
P(Y=40/X=26) = 45/57 = 0.79
P(Y=50/X=26) = 8/57 = 0.14
P(Y=60/X=26) = 4/57 = 0.0702
Умовне математичне очікування M = 20 * 0 + 30 * 0 + 40 * 0.79 + 50 * 0.14 + 60 * 0.0702 = 42.81
Умовна дисперсія D = 20 2 * 0 + 30 2 * 0 + 40 2 * 0.79 + 50 2 * 0.14 + 60 2 * 0.0702 - 42.81 2 = 34.23
Умовний закон розподілу Y(X=31).
P(Y=20/X=31) = 0/17 = 0
P(Y=30/X=31) = 0/17 = 0
P(Y=40/X=31) = 4/17 = 0.24
P(Y=50/X=31) = 6/17 = 0.35
P(Y=60/X=31) = 7/17 = 0.41
Умовне математичне очікування M = 20 * 0 + 30 * 0 + 40 * 0.24 + 50 * 0.35 + 60 * 0.41 = 51.76
Умовна дисперсія D = 20 2 * 0 + 30 2 * 0 + 40 2 * 0.24 + 50 2 * 0.35 + 60 2 * 0.41 - 51.76 2 = 61.59
Умовний закон розподілу Y(X=36).
P(Y=20/X=36) = 0/3 = 0
P(Y=30/X=36) = 0/3 = 0
P(Y=40/X=36) = 0/3 = 0
P(Y=50/X=36) = 0/3 = 0
P(Y=60/X=36) = 3/3 = 1
Умовне математичне очікування M = 20 * 0 + 30 * 0 + 40 * 0 + 50 * 0 + 60 * 1 = 60
Умовна дисперсія D = 20 2 * 0 + 30 2 * 0 + 40 2 * 0 + 50 2 * 0 + 60 2 * 1 - 60 2 = 0
Коваріація.
cov(X,Y) = M - M[X] · M[Y]
cov(X,Y) = (20·11·2 + 20·16·4 + 30·16·6 + 30·21·3 + 40·21·6 + 50·21·2 + 40·26·45 + 50 · 26 · 8 + 60 · 26 · 4 + 40 · 31 · 4 + 50 · 31 · 6 + 60 · 31 · 7 + 60 · 36 · 3)/100 - 25.3 · 42.3 = 38.11
Якщо випадкові величини незалежні, їх коваріації дорівнює нулю. У разі cov(X,Y) ≠ 0.
Коефіцієнт кореляції.


Рівняння лінійної регресії з y на x має вигляд:

Рівняння лінійної регресії з x на y має вигляд:

Знайдемо необхідні числові характеристики.
Вибіркові середні:
x = (20 (2 + 4) + 30 (6 + 3) + 40 (6 + 45 + 4) + 50 (2 + 8 + 6) + 60 (4 + 7 + 3)) / 100 = 42.3
y = (20 (2 + 4) + 30 (6 + 3) + 40 (6 + 45 + 4) + 50 (2 + 8 + 6) + 60 (4 + 7 + 3)) / 100 = 25.3
Дисперсії:
σ 2 x = (20 2 (2 + 4) + 30 2 (6 + 3) + 40 2 (6 + 45 + 4) + 50 2 (2 + 8 + 6) + 60 2 (4 + 7 + 3) )/100 – 42.3 2 = 99.71
σ 2 y = (11 2 (2) + 16 2 (4 + 6) + 21 2 (3 + 6 + 2) + 26 2 (45 + 8 + 4) + 31 2 (4 + 6 + 7) + 36 2 (3))/100 – 25.3 2 = 24.01
Звідки отримуємо середньоквадратичні відхилення:
σ x = 9.99 та σ y = 4.9
та підступність:
Cov (x, y) = (20 · 11 · 2 + 20 · 16 · 4 + 30 · 16 · 6 + 30 · 21 · 3 + 40 · 21 · 6 + 50 · 21 · 2 + 40 · 26 · 45 + 50 · 26 · 8 + 60 · 26 · 4 + 40 · 31 · 4 + 50 · 31 · 6 + 60 · 31 · 7 + 60 · 36 · 3)/100 - 42.3 · 25.3 = 38.11
Визначимо коефіцієнт кореляції:


Запишемо рівняння ліній регресії y(x):

та обчислюючи, отримуємо:
y x = 0.38 x + 9.14
Запишемо рівняння ліній регресії x(y):

та обчислюючи, отримуємо:
x y = 1.59 y + 2.15
Якщо побудувати точки, що визначаються таблицею та лінії регресії, побачимо, що обидві лінії проходять через точку з координатами (42.3; 25.3) та точки розташовані близько до ліній регресії.
Значимість коефіцієнта кореляції.

По таблиці Стьюдента з рівнем значимості α=0.05 і ступенями свободи k=100-m-1 = 98 знаходимо t крит:
t критий (n-m-1;α/2) = (98;0.025) = 1.984
де m = 1 – кількість пояснюючих змінних.
Якщо t набл > t критич, то отримане значення коефіцієнта кореляції визнається значущим (нульова гіпотеза, яка стверджує рівність нуля коефіцієнта кореляції, відкидається).
Оскільки t набл > t критий, то відхиляємо гіпотезу про рівність 0 коефіцієнта кореляції. Інакше кажучи, коефіцієнт кореляції статистично - значущий.

Завдання. Кількість попадань пар значень випадкових величин X і Y відповідні інтервали наведені в таблиці. За цими даними знайти вибірковий коефіцієнт кореляції та вибіркові рівняння прямих ліній регресії Y на X та X на Y.
Рішення

Приклад. Розподіл ймовірностей двовимірної випадкової величини (X, Y) встановлено таблицею. Знайти закони розподілу складових величин X, Y та коефіцієнт кореляції p(X, Y).
Завантажити рішення

Завдання. Двовимірна дискретна величина (X, Y) задана законом розподілу. Знайти закони розподілу складових X та Y, підступність та коефіцієнт кореляції.

Нехай дана двовимірна випадкова величина $ (X, Y) $.

Визначення 1

Законом розподілу двовимірної випадкової величини $(X,Y)$ - називається безліч можливих пар чисел $(x_i,\ y_j)$ (де $x_i \epsilon X,\ y_j \epsilon Y$) та їх ймовірностей $p_(ij)$ .

Найчастіше закон розподілу двовимірної випадкової величини записується як таблиці (Таблиця 1).

Рисунок 1. Закон розподілу двовимірної випадкової величини.

Згадаймо тепер теорему про складання ймовірностей незалежних подій.

Теорема 1

Імовірність суми кінцевого числа незалежних подій $(\ A)_1$, $(\ A)_2$, ... ,$\ (\ A)_n$ обчислюється за формулою:

Користуючись цією формулою, можна отримати закони розподілу для кожної компоненти двовимірної випадкової величини, тобто:

Звідси випливатиме, що сума всіх ймовірностей двовимірної системи має такий вигляд:

Розглянемо докладно (поетапно) завдання, що з поняттям закону розподілу двовимірної випадкової величини.

Приклад 1

Закон розподілу двовимірної випадкової величини заданий наступною таблицею:

Рисунок 2.

Знайти закони розподілу випадкових величин $X,\Y$, $X+Y$ і перевірити у кожному разі виконання рівності повної суми ймовірностей одиниці.

  1. Знайдемо спочатку розподіл випадкової величини $ X $. Випадкова величина $X$ може набувати значень $x_1=2,$ $x_2=3$, $x_3=5$. Для знаходження розподілу користуватимемося теоремою 1.

Знайдемо спочатку суму ймовірностей $x_1$ таким чином:

Рисунок 3.

Аналогічно знайдемо $P\left(x_2\right)$ і $P\left(x_3\right)$:

\ \

Рисунок 4.

  1. Знайдемо тепер розподіл випадкового розміру $Y$. Випадкова величина $Y$ може набувати значень $x_1=1,$ $x_2=3$, $x_3=4$. Для знаходження розподілу користуватимемося теоремою 1.

Знайдемо спочатку суму ймовірностей $y_1$ таким чином:

Малюнок 5.

Аналогічно знайдемо $P\left(y_2\right)$ і $P\left(y_3\right)$:

\ \

Отже, закон розподілу величини $X$ має такий вигляд:

Рисунок 6.

Перевіримо виконання рівності повної суми ймовірностей:

  1. Залишилося визначити закон розподілу випадкової величини $X+Y$.

Позначимо її зручності через $Z$: $Z=X+Y$.

Спочатку знайдемо, які значення може набувати дана величина. Для цього попарно складатимемо значення величин $X$ і $Y$. Отримаємо наступні значення: 3, 4, 6, 5, 6, 8, 6, 7, 9. Тепер, відкидаючи збіглися величини, отримаємо, що випадкова величина $X+Y$ може набувати значення $z_1=3,\ z_2=4 \ z_3 = 5, \ z_4 = 6, \ z_5 = 7, \ z_6 = 8, \ z_7 = 9. \ $

Знайдемо для початку $P(z_1)$. Так як значення $ z_1 $ одинично, воно знаходиться наступним чином:

Рисунок 7.

Аналогічно знаходяться всі ймовірності, крім $P(z_4)$:

Знайдемо тепер $P(z_4)$ так:

Малюнок 8.

Отже, закон розподілу величини $Z$ має такий вигляд:

Рисунок 9.

Перевіримо виконання рівності повної суми ймовірностей:

Визначення.Якщо на тому самому просторі елементарних подій задані дві випадкові величини Хі Y,то кажуть, що задано двовимірна випадкова величина (Х, Y) .

приклад.Верстат штампує сталеві плитки. Контролюються довжина Хта ширина Y. − двовимірна СВ.

СВ Хі Yмають свої функції розподілу та інші характеристики.

Визначення. Функцією розподілу двовимірної випадкової величини (Х, Y) називається функція.

Визначення. Законом розподілу дискретної двовимірної випадкової величини (Х, Y) називається таблиця

Для двовимірної дискретної СВ.

Властивості:

2) якщо , то ; якщо то ;

4) − функція розподілу Х;

− функція розподілу Y.

Імовірність попадання значень двовимірної СВ у прямокутник:

Визначення.Двовимірна випадкова величина (Х, Y)називається безперервний , якщо її функція розподілу безперервна на і має всюди (за винятком, можливо, кінцевого числа кривих) безперервну змішану приватну похідну 2-го порядку .

Визначення. Щільністю спільного розподілу ймовірностей двовимірної безперервної СВ називається функція.

Тоді, мабуть, .

приклад 1.Двовимірна безперервна СВ задана функцією розподілу

Тоді щільність розподілу має вигляд

приклад 2.Двовимірна безперервна СВ задана щільністю розподілу

Знайдемо її функцію розподілу:

Властивості:

3) для будь-якої області.

Нехай відома щільність спільного розподілу. Тоді щільність розподілу кожної із складових двовимірної СВ знаходиться так:

Приклад 2 (продовження).

Щільності розподілу складової двовимірної СВ деякі автори називають маргінальнимищільністю розподілу ймовірностей .

Умовні закони розподілу складових системи дискретних СВ.

Умовна ймовірність, де.

Умовний закон розподілу складової Хпри:

Х
Р

Аналогічно для де .

Складемо умовний закон розподілу Хпри Y= 2.

Тоді умовний закон розподілу

Х -1
Р

Визначення. Умовною щільністю розподілу складової Х при заданому значенні Y=yназивається .

Аналогічно: .

Визначення. Умовним математичним очікуванням дискретної СВ Y якщо називається , де − див. вище.

Отже, .

Для безперервнийСВ Y .

Очевидно, що є функцією аргументу х. Ця функція називається функцією регресії Y на Х .

Аналогічно визначається функція регресії Х на Y : .

Теорема 5. (Про функцію розподілу незалежних СВ)

СВ Хі Y

Наслідок.Безперервні СВ Хі Yє незалежними і тоді, коли .

У прикладі 1 при . Отже, СВ Хі Yнезалежні.

Числові характеристики складових двовимірної випадкової величини

Для дискретної СВ:

Для безперервного СВ: .

Дисперсія та середнє квадратичне відхилення для всіх СВ визначаються за одним і тим же відомим нам формулам:

Визначення.Крапка називається центром розсіювання двовимірної СВ.

Визначення. Коваріацією (кореляційним моментом) СВ називається

Для дискретної СВ: .

Для безперервного СВ: .

Формула для обчислення: .

Для незалежних СВ.

Незручністю характеристики є її розмірність (квадрат одиниці виміру складових). Від цього недоліку вільна наступна величина.

Визначення. Коефіцієнтом кореляції СВ Хі Yназивається

Для незалежних СВ.

Для будь-якої пари СВ . Відомо що і тоді, коли , де .

Визначення.СВ Хі Yназиваються некорельованими , якщо .

Зв'язок між корелюваністю та залежністю СВ:

− якщо СВ Хі Yкорельовані, тобто. , то вони залежні; зворотне неправильне;

− якщо СВ Хі Yнезалежні, то ; зворотне не вірно.

Примітка 1.Якщо СВ Хі Yрозподілені за нормальним законом та , то вони незалежні.

Примітка 2.Практичне значення як міра залежності виправдано лише тоді, коли спільний розподіл пари нормально або приблизно нормально. Для довільних СВ Хі Yможна дійти помилкового висновку, тобто. може бути навіть тоді, коли Хі Yпов'язані строгою функціональною залежністю.

Зауваження3.У математичній статистиці кореляцією називають ймовірнісну (статистичну) залежність між величинами, що не має, взагалі кажучи, строго функціонального характеру. Кореляційна залежність виникає тоді, коли одна з величин залежить не тільки від цієї другої, а й від низки випадкових факторів, або коли серед умов, від яких залежить одна чи інша величина, є спільні для них обох умови.

Приклад 4.Для СВ Хі Yз прикладу 3 знайти .

Рішення.

Приклад 5.Дана щільність спільного розподілу двовимірної СВ.

Упорядкована пара (X, Y) випадкових величин X і Y називається двовимірною випадковою величиною, або випадковим вектором двовимірного простору. Двовимірна випадкова величина (X,Y) називається також системою випадкових величина X і Y. Багато всіх можливих значень дискретної випадкової величини з їх ймовірностями називається законом розподілу цієї випадкової величини. Дискретна двовимірна випадкова величина (X, Y) вважається заданою, якщо відомий її закон розподілу:

P(X=x i , Y=y j) = p ij , i=1,2...,n, j=1,2...,m

Призначення сервісу. За допомогою сервісу за заданим законом розподілу можна знайти:

  • ряди розподілу X та Y, математичне очікування M[X], M[Y], дисперсію D[X], D[Y];
  • коваріацію cov(x,y), коефіцієнт кореляції r x,y, умовний ряд розподілу X, умовне математичне очікування M;
Крім цього, дається відповідь на питання, "чи залежні випадкові величини X та Y?".

Інструкція. Вкажіть розмірність матриці розподілу ймовірностей (кількість рядків та стовпців) та її вигляд. Отримане рішення зберігається у файлі Word.

Приклад №1. Двовимірна дискретна випадкова величина має таблицю розподілу:

Y/X 1 2 3 4
10 0 0,11 0,12 0,03
20 0 0,13 0,09 0,02
30 0,02 0,11 0,08 0,01
40 0,03 0,11 0,05 q
Знайти величину q та коефіцієнт кореляції цієї випадкової величини.

Рішення. Величину q знайдемо із умови Σp ij = 1
Σp ij = 0,02 + 0,03 + 0,11 + … + 0,03 + 0,02 + 0,01 + q = 1
0.91 + q = 1. Звідки q = 0.09

Користуючись формулою ∑P(x i,y j) = p i(j=1..n), знаходимо ряд розподілу X.

Математичне очікування M[Y].
M[y] = 1 * 0.05 + 2 * 0.46 + 3 * 0.34 + 4 * 0.15 = 2.59
Дисперсія D[Y] = 1 2 *0.05 + 2 2 *0.46 + 3 2 *0.34 + 4 2 *0.15 - 2.59 2 = 0.64
Середнє квадратичне відхиленняσ(y) = sqrt(D[Y]) = sqrt(0.64) = 0.801

Коваріація cov(X,Y) = M - M[X]·M[Y] = 2·10·0.11 + 3·10·0.12 + 4·10·0.03 + 2·20·0.13 + 3·20·0.09 + 4 ·20·0.02 + 1·30·0.02 + 2·30·0.11 + 3·30·0.08 + 4·30·0.01 + 1·40·0.03 + 2·40·0.11 + 3·40·0.05 + 4·40 · 0.09 - 25.2 · 2.59 = -0.068
Коефіцієнт кореляції r xy = cov(x,y)/σ(x)&sigma(y) = -0.068/(11.531*0.801) = -0.00736

Приклад 2 . Дані статистичної обробки відомостей щодо двох показників X та Y відображені у кореляційній таблиці. Потрібно:

  1. написати ряди розподілу для X і Y та обчислити для них вибіркові середні та вибіркові середні квадратичні відхилення;
  2. написати умовні ряди розподілу Y/x та обчислити умовні середні Y/x;
  3. зобразити графічно залежність умовних середніх Y/x від значень X;
  4. розрахувати вибірковий коефіцієнт кореляції Y X;
  5. написати вибіркове рівняння прямої регресії;
  6. зобразити геометричні дані кореляційної таблиці та побудувати пряму регресію.
Рішення. Упорядкована пара (X,Y) випадкових величин X і Y називається двовимірною випадковою величиною, або випадковим вектором двовимірного простору. Двовимірна випадкова величина (X,Y) називається також системою випадкових величина X та Y.
Безліч всіх можливих значень дискретної випадкової величини зі своїми ймовірностями називається законом розподілу цієї випадкової величини.
Дискретна двовимірна випадкова величина (X,Y) вважається заданою, якщо відомий її закон розподілу:
P(X=x i , Y=y j) = p ij , i=1,2...,n, j=1,2..,m
X/Y20 30 40 50 60
11 2 0 0 0 0
16 4 6 0 0 0
21 0 3 6 2 0
26 0 0 45 8 4
31 0 0 4 6 7
36 0 0 0 0 3
Події (X=x i , Y=y j) утворюють повну групу подій, тому сума всіх ймовірностей p ij ( i=1,2...,n, j=1,2..,m), зазначених у таблиці, дорівнює 1.
1. Залежність випадкових величин X та Y.
Знаходимо ряди розподілу X та Y.
Користуючись формулою ∑P(x i,y j) = p i(j=1..n), знаходимо ряд розподілу X. Математичне очікування M[Y].
M[y] = (20 * 6 + 30 * 9 + 40 * 55 + 50 * 16 + 60 * 14) / 100 = 42.3
Дисперсія D[Y].
D[Y] = (20 2 *6 + 30 2 *9 + 40 2 *55 + 50 2 *16 + 60 2 *14)/100 - 42.3 2 = 99.71
Середнє квадратичне відхилення σ(y).

Оскільки, P(X=11,Y=20) = 2≠2·6, то випадкові величини X та Y залежні.
2. Умовний закон розподілу X.
Умовний закон розподілу X(Y=20).
P(X=11/Y=20) = 2/6 = 0.33
P(X=16/Y=20) = 4/6 = 0.67
P(X=21/Y=20) = 0/6 = 0
P(X=26/Y=20) = 0/6 = 0
P(X=31/Y=20) = 0/6 = 0
P(X=36/Y=20) = 0/6 = 0
Умовне математичне очікування M = 11 * 0.33 + 16 * 0.67 + 21 * 0 + 26 * 0 + 31 * 0 + 36 * 0 = 14.33
Умовна дисперсія D = 11 2 * 0.33 + 16 2 * 0.67 + 21 2 * 0 + 26 2 * 0 + 31 2 * 0 + 36 2 * 0 - 14.33 2 = 5.56
Умовний закон розподілу X(Y=30).
P(X=11/Y=30) = 0/9 = 0
P(X=16/Y=30) = 6/9 = 0.67
P(X=21/Y=30) = 3/9 = 0.33
P(X=26/Y=30) = 0/9 = 0
P(X=31/Y=30) = 0/9 = 0
P(X=36/Y=30) = 0/9 = 0
Умовне математичне очікування M = 11 * 0 + 16 * 0.67 + 21 * 0.33 + 26 * 0 + 31 * 0 + 36 * 0 = 17.67
Умовна дисперсія D = 11 2 *0 + 16 2 *0.67 + 21 2 *0.33 + 26 2 *0 + 31 2 *0 + 36 2 *0 - 17.67 2 = 5.56
Умовний закон розподілу X(Y=40).
P(X=11/Y=40) = 0/55 = 0
P(X=16/Y=40) = 0/55 = 0
P(X=21/Y=40) = 6/55 = 0.11
P(X=26/Y=40) = 45/55 = 0.82
P(X=31/Y=40) = 4/55 = 0.0727
P(X=36/Y=40) = 0/55 = 0
Умовне математичне очікування M = 11 * 0 + 16 * 0 + 21 * 0.11 + 26 * 0.82 + 31 * 0.0727 + 36 * 0 = 25.82
Умовна дисперсія D = 11 2 *0 + 16 2 *0 + 21 2 *0.11 + 26 2 *0.82 + 31 2 *0.0727 + 36 2 *0 - 25.82 2 = 4.51
Умовний закон розподілу X(Y=50).
P(X=11/Y=50) = 0/16 = 0
P(X=16/Y=50) = 0/16 = 0
P(X=21/Y=50) = 2/16 = 0.13
P(X=26/Y=50) = 8/16 = 0.5
P(X=31/Y=50) = 6/16 = 0.38
P(X=36/Y=50) = 0/16 = 0
Умовне математичне очікування M = 11 * 0 + 16 * 0 + 21 * 0.13 + 26 * 0.5 + 31 * 0.38 + 36 * 0 = 27.25
Умовна дисперсія D = 11 2 *0 + 16 2 *0 + 21 2 *0.13 + 26 2 *0.5 + 31 2 *0.38 + 36 2 *0 - 27.25 2 = 10.94
Умовний закон розподілу X(Y=60).
P(X=11/Y=60) = 0/14 = 0
P(X=16/Y=60) = 0/14 = 0
P(X=21/Y=60) = 0/14 = 0
P(X=26/Y=60) = 4/14 = 0.29
P(X=31/Y=60) = 7/14 = 0.5
P(X=36/Y=60) = 3/14 = 0.21
Умовне математичне очікування M = 11 * 0 + 16 * 0 + 21 * 0 + 26 * 0.29 + 31 * 0.5 + 36 * 0.21 = 30.64
Умовна дисперсія D = 11 2 *0 + 16 2 *0 + 21 2 *0 + 26 2 *0.29 + 31 2 *0.5 + 36 2 *0.21 - 30.64 2 = 12.37
3. Умовний закон розподілу Y.
Умовний закон розподілу Y(X=11).
P(Y=20/X=11) = 2/2 = 1
P(Y=30/X=11) = 0/2 = 0
P(Y=40/X=11) = 0/2 = 0
P(Y=50/X=11) = 0/2 = 0
P(Y=60/X=11) = 0/2 = 0
Умовне математичне очікування M = 20 * 1 + 30 * 0 + 40 * 0 + 50 * 0 + 60 * 0 = 20
Умовна дисперсія D = 20 2 * 1 + 30 2 * 0 + 40 2 * 0 + 50 2 * 0 + 60 2 * 0 - 20 2 = 0
Умовний закон розподілу Y(X=16).
P(Y=20/X=16) = 4/10 = 0.4
P(Y=30/X=16) = 6/10 = 0.6
P(Y=40/X=16) = 0/10 = 0
P(Y=50/X=16) = 0/10 = 0
P(Y=60/X=16) = 0/10 = 0
Умовне математичне очікування M = 20 * 0.4 + 30 * 0.6 + 40 * 0 + 50 * 0 + 60 * 0 = 26
Умовна дисперсія D = 20 2 * 0.4 + 30 2 * 0.6 + 40 2 * 0 + 50 2 * 0 + 60 2 * 0 - 26 2 = 24
Умовний закон розподілу Y(X=21).
P(Y=20/X=21) = 0/11 = 0
P(Y=30/X=21) = 3/11 = 0.27
P(Y=40/X=21) = 6/11 = 0.55
P(Y=50/X=21) = 2/11 = 0.18
P(Y=60/X=21) = 0/11 = 0
Умовне математичне очікування M = 20 * 0 + 30 * 0.27 + 40 * 0.55 + 50 * 0.18 + 60 * 0 = 39.09
Умовна дисперсія D = 20 2 * 0 + 30 2 * 0.27 + 40 2 * 0.55 + 50 2 * 0.18 + 60 2 * 0 - 39.09 2 = 44.63
Умовний закон розподілу Y(X=26).
P(Y=20/X=26) = 0/57 = 0
P(Y=30/X=26) = 0/57 = 0
P(Y=40/X=26) = 45/57 = 0.79
P(Y=50/X=26) = 8/57 = 0.14
P(Y=60/X=26) = 4/57 = 0.0702
Умовне математичне очікування M = 20 * 0 + 30 * 0 + 40 * 0.79 + 50 * 0.14 + 60 * 0.0702 = 42.81
Умовна дисперсія D = 20 2 * 0 + 30 2 * 0 + 40 2 * 0.79 + 50 2 * 0.14 + 60 2 * 0.0702 - 42.81 2 = 34.23
Умовний закон розподілу Y(X=31).
P(Y=20/X=31) = 0/17 = 0
P(Y=30/X=31) = 0/17 = 0
P(Y=40/X=31) = 4/17 = 0.24
P(Y=50/X=31) = 6/17 = 0.35
P(Y=60/X=31) = 7/17 = 0.41
Умовне математичне очікування M = 20 * 0 + 30 * 0 + 40 * 0.24 + 50 * 0.35 + 60 * 0.41 = 51.76
Умовна дисперсія D = 20 2 * 0 + 30 2 * 0 + 40 2 * 0.24 + 50 2 * 0.35 + 60 2 * 0.41 - 51.76 2 = 61.59
Умовний закон розподілу Y(X=36).
P(Y=20/X=36) = 0/3 = 0
P(Y=30/X=36) = 0/3 = 0
P(Y=40/X=36) = 0/3 = 0
P(Y=50/X=36) = 0/3 = 0
P(Y=60/X=36) = 3/3 = 1
Умовне математичне очікування M = 20 * 0 + 30 * 0 + 40 * 0 + 50 * 0 + 60 * 1 = 60
Умовна дисперсія D = 20 2 * 0 + 30 2 * 0 + 40 2 * 0 + 50 2 * 0 + 60 2 * 1 - 60 2 = 0
Коваріація.
cov(X,Y) = M - M[X] · M[Y]
cov(X,Y) = (20·11·2 + 20·16·4 + 30·16·6 + 30·21·3 + 40·21·6 + 50·21·2 + 40·26·45 + 50 · 26 · 8 + 60 · 26 · 4 + 40 · 31 · 4 + 50 · 31 · 6 + 60 · 31 · 7 + 60 · 36 · 3)/100 - 25.3 · 42.3 = 38.11
Якщо випадкові величини незалежні, їх коваріації дорівнює нулю. У разі cov(X,Y) ≠ 0.
Коефіцієнт кореляції.


Рівняння лінійної регресії з y на x має вигляд:

Рівняння лінійної регресії з x на y має вигляд:

Знайдемо необхідні числові характеристики.
Вибіркові середні:
x = (20 (2 + 4) + 30 (6 + 3) + 40 (6 + 45 + 4) + 50 (2 + 8 + 6) + 60 (4 + 7 + 3)) / 100 = 42.3
y = (20 (2 + 4) + 30 (6 + 3) + 40 (6 + 45 + 4) + 50 (2 + 8 + 6) + 60 (4 + 7 + 3)) / 100 = 25.3
Дисперсії:
σ 2 x = (20 2 (2 + 4) + 30 2 (6 + 3) + 40 2 (6 + 45 + 4) + 50 2 (2 + 8 + 6) + 60 2 (4 + 7 + 3) )/100 – 42.3 2 = 99.71
σ 2 y = (11 2 (2) + 16 2 (4 + 6) + 21 2 (3 + 6 + 2) + 26 2 (45 + 8 + 4) + 31 2 (4 + 6 + 7) + 36 2 (3))/100 – 25.3 2 = 24.01
Звідки отримуємо середньоквадратичні відхилення:
σ x = 9.99 та σ y = 4.9
та підступність:
Cov (x, y) = (20 · 11 · 2 + 20 · 16 · 4 + 30 · 16 · 6 + 30 · 21 · 3 + 40 · 21 · 6 + 50 · 21 · 2 + 40 · 26 · 45 + 50 · 26 · 8 + 60 · 26 · 4 + 40 · 31 · 4 + 50 · 31 · 6 + 60 · 31 · 7 + 60 · 36 · 3)/100 - 42.3 · 25.3 = 38.11
Визначимо коефіцієнт кореляції:


Запишемо рівняння ліній регресії y(x):

та обчислюючи, отримуємо:
y x = 0.38 x + 9.14
Запишемо рівняння ліній регресії x(y):

та обчислюючи, отримуємо:
x y = 1.59 y + 2.15
Якщо побудувати точки, що визначаються таблицею та лінії регресії, побачимо, що обидві лінії проходять через точку з координатами (42.3; 25.3) та точки розташовані близько до ліній регресії.
Значимість коефіцієнта кореляції.

По таблиці Стьюдента з рівнем значимості α=0.05 і ступенями свободи k=100-m-1 = 98 знаходимо t крит:
t критий (n-m-1;α/2) = (98;0.025) = 1.984
де m = 1 – кількість пояснюючих змінних.
Якщо t набл > t критич, то отримане значення коефіцієнта кореляції визнається значущим (нульова гіпотеза, яка стверджує рівність нуля коефіцієнта кореляції, відкидається).
Оскільки t набл > t критий, то відхиляємо гіпотезу про рівність 0 коефіцієнта кореляції. Інакше кажучи, коефіцієнт кореляції статистично - значущий.

Завдання. Кількість попадань пар значень випадкових величин X і Y відповідні інтервали наведені в таблиці. За цими даними знайти вибірковий коефіцієнт кореляції та вибіркові рівняння прямих ліній регресії Y на X та X на Y.
Рішення

Приклад. Розподіл ймовірностей двовимірної випадкової величини (X, Y) встановлено таблицею. Знайти закони розподілу складових величин X, Y та коефіцієнт кореляції p(X, Y).
Завантажити рішення

Завдання. Двовимірна дискретна величина (X, Y) задана законом розподілу. Знайти закони розподілу складових X та Y, підступність та коефіцієнт кореляції.

Визначення 2.7. це пара випадкових чисел (X, Y),чи точка на координатній площині (рис. 2.11).

Рис. 2.11.

Двовимірна випадкова величина - це окремий випадок багатовимірної випадкової величини, або випадкового вектора.

Визначення 2.8. Випадковий векторце випадкова функція?,(/) з кінцевою множиною можливих значень аргументу t,значення якої за будь-якого значення tє випадковою величиною.

Двовимірна випадкова величина називається безперервною, якщо її координати безперервні, та дискретною, якщо її координати дискретні.

Задати закон розподілу двовимірних випадкових величин - це встановити відповідність між її можливими значеннями і ймовірністю цих значень. За методами завдання випадкові величини діляться на безперервні і дискретні, хоча є загальні методи завдання закону розподілу будь-який СВ.

Дискретна двовимірна випадкова величина

Дискретна двовимірна випадкова величина визначається за допомогою таблиці розподілів (табл. 2.1).

Таблиця 2.1

Таблиця розподілу (спільний розподіл) СВ ( X, У)

Елементи таблиці визначаються формулою

Властивості елементів таблиці розподілу:

Розподіл по кожній координаті називається одномірнимабо маргінальним:

р 1> = Р(Х =.г,) - маргінальний розподіл СВ X;

р^ 2) = P(Y= у,)- Маргінальний розподіл СВ У.

Зв'язок спільного розподілу СВ Xі У, заданого безліччю ймовірностей [р()), i = 1,..., n,j = 1,..., т(таблицею розподілу), та маргінального розподілу.


Аналогічно для СВ У р-2)= X р, г

Завдання 2.14. Дано:

Безперервна двовимірна випадкова величина

/(х, y)dxdy- елемент ймовірності для двовимірної випадкової величини (X, У) - ймовірність попадання випадкової величини (X, У) у прямокутник зі сторонами cbc, dyпри dx, dy -* 0:

f(x, у) - щільність розподілудвовимірної випадкової величини (X, У). Завданням / (х, у)ми надаємо повну інформацію про розподіл двовимірної випадкової величини.

Маргінальні розподіли задаються наступним чином: X - щільністю розподілу СВ X/,(х); по Y- Щільністю розподілу СВ У f>(y).

Завдання закону розподілу двовимірної випадкової величини функцією розподілу

Універсальним способом завдання закону розподілу для дискретної або безперервної двовимірної випадкової величини є функція розподілу F(x, у).

Визначення 2.9. Функція розподілу F(x, у)- можливість спільної появи подій (Ху), тобто. F(x 0 ,y n) = = Р(Ху), кинутої на координатну площину, потрапити в нескінченний квадрант з вершиною в точці М(х 0 у і)(В заштриховану на рис. 2.12 область).

Рис. 2.12.Ілюстрація функції розподілу F( х, у)

Властивості функції F(x, у)

  • 1) 0 1;
  • 2) F(-oo,-оо) = F(x,-оо) = F(-oo, у) = 0; F(оо, оо) = 1;
  • 3) F(x, у)- Незменшує по кожному аргументу;
  • 4) F(x, у) -безперервна зліва та знизу;
  • 5) узгодженість розподілів:

F(x, X: F(x,оо) = F, (x); F(y,оо) - маргінальний розподіл по Y F(оо, у) = F2(y).Зв'язок /(х, у)з F(x, у):

Зв'язок спільної густини з маргінальною. Дана f(x, у).Отримаємо маргінальні густини розподілу f(x),f2(y)".


Випадок незалежних координат двовимірної випадкової величини

Визначення 2.10. СВ Xі Yнезалежні(нз), якщо незалежні будь-які події, пов'язані з кожним із цих СВ. З визначення нз СВ випливає:

  • 1 )Pij = p X) pf
  • 2 )F(x,y) = Fl(x)F2(y).

Виявляється, що для незалежних СВ Xі Yвиконано та

3 ) f (x, y) = J (x) f, (y).

Доведемо, що для незалежних СВ Xі Y 2) 3). Доведення,а) Нехай виконано 2), тобто.

в той же час F(x, y) = f J f(u,v)dudv,звідки і випливає 3);

б) нехай тепер виконано 3), тоді


тобто. Правильно 2).

Розглянемо завдання.

Завдання 2.15. Розподіл задано наступною таблицею:

Будуємо маргінальні розподіли:

Отримуємо Р(Х = 3, У = 4) = 0,17 * Р(Х = 3) Р(У = 4) = 0,1485 => => СВ Xта Узалежнені.

Функція розподілу:


Завдання 2.16. Розподіл задано наступною таблицею:

Отримуємо P tl = 0,2 0,3 = 0,06; Р 12 = 0,2? 0,7 = 0,14; P 2l = 0,8 ? 0,3 = = 0,24; Р 22 - 0,8 0,7 = 0,56 => СВ Xі Yнз.

Завдання 2.17. Дана / (х, у) = 1/я ехр| -0,5 (д" + 2ху + 5г/2)]. Знайти А(х)і /Ау)-

Рішення

(Порахуйте самостійно).