Двумерные и многомерные случайные величины

Лекция 5. Двумерные и многомерные случайные величины

Двумерная СВ, совместная функция распределения и ее свойства. Дискретная двумерная СВ. Непрерывная двумерная СВ. Независимые случайные величины. Ковариация и коэффициент корреляции СВ, их свойства. Условное математическое ожидание. Регрессия.

ОЛ-1 гл 5, 7, 8.

Определение. Совокупность случайных величин X1 = X1(), .... Хп = Хn(), заданных на одном и той же вероятностном пространстве (, B, Р), называют многомерной (n-мерной) случайной величиной, или n-мерным случайным вектором. При этом сами случайные величины Х1, Х2, ..., Хп называют координатами случайного вектора. В частности, при n = 1 говорят об одномерной, при n = 2 двумерной случайной величине (или двумерном случайном векторе).

Пример. Отклонение точки разрыва снаряда от точки прицеливания при стрельбе по плоской цели можно задать двумерной случайной величиной (X, Y), где X отклонение по дальности, а Y отклонение в боковом направлении.

Определение. Функцией распределения (вероятностей)

(n-мерного) случайного вектора называют функцию, значение которой в точке равно вероятности совместного осуществления (пересечения) событий {X1 < x1}, ..., {Xn < xn}, т.е.

Функцию распределения называют также совместной (n-мерной) функцией распределения случайных величин Х1, Х2, ..., Хп.

Теорема. Двумерная функция распределения удовлетворяет следующим свойствам.

1. 0  F(x1, x2)  1.

2. F(x1, x2) неубывающая функция по каждому из аргументов х1 и х2.

3. .

4. .

5. .

6. F(x1, x2) непрерывная слева в любой точке по каждому из аргументов x1 и x2 функция.

7. , .

Доказательство. Утверждения 1 и 2 доказываются точно так же, как и в одномерном случае. 3. События {Х1 < } и {Х2 < } являются невозможными, а пересечение невозможного события с любым событием, как известно, также невозможное событие, вероятность которого равна нулю. Отсюда с учетом определения вытекает утверждение 3.

Аналогично из того, что события {Х1 < +} и {Х2 < +} так же, как и их пересечение, являются достоверными, вероятность которых равна единице, вытекает утверждение 4.

Чтобы найти вероятность попадания двумерной случайной величины (Х1, Х2) в прямоугольник (на рис. заштрихован), сначала определим вероятность попадания в полуполосу (отмечена двойной штриховкой). Но эта вероятность представляет собой вероятность попадания в квадрант за вычетом вероятности попадания в квадрант т.е.

Теперь осталось заметить, что вероятность попадания в прямоугольник совпадает с вероятностью попадания в полуполосу , из которой вычитается вероятность попадания в полуполосу , равная . Окончательно получим утверждение 5.

Подобно одномерному случаю доказывается и утверждение 6. Наконец, событие {Х2 < +} является достоверным, поэтому

Утверждение 7 устанавливает естественную связь между двумерной функцией распределения случайного вектора (Х1, Х2) и функциями и , которые называют одномерными (говорят также частными, или маргинальными) функциями распределения случайных величин X1 и Х2.

Дискретные двумерные случайные величины

Определение. Двумерную случайную величину (X, Y) называют дискретной, если каждая из случайных величин X и Y является дискретной.

Как и в одномерном случае, распределение двумерной дискретной случайной величины естественно описать с помощью перечисления всевозможных пар (xi, yi) значений координат случайного вектора (X, Y) и соответствующих вероятностей, с которыми эти пары значений принимают случайные величины X и Y.

Для простоты ограничимся конечным множеством возможных значений, когда случайная величина X может принимать только значения х1, ..., хп, Y значения y1, ..., yп. Такое перечисление удобно представить в виде таблицы.

Используя табл., нетрудно определить совместную функцию распределения FX,Y(x, y). Ясно, что для этого необходимо просуммировать рij по всем тем значениям i и j, для которых xi < х, yj < у, т.е.

Пример. В соответствии со схемой Бернулли с вероятностью успеха р и вероятностью неудачи q = 1  р проводятся два испытания. Выпишем распределение двумерного случайного вектора (X1, Х2), где Xi, i = 1,2, число успехов в i-м испытании. Каждая из случайных величин Х1 и Х2 может принимать два значения: 0 или 1.

Непрерывные случайные величины

Определение. Непрерывной двумерной случайной величиной (X, Y) называют такую двумерную случайную величину (X, Y), совместную функцию распределения которой можно представить в виде сходящегося несобственного интеграла:

Функцию называют совместной двумерной плотностью распределения случайных величин X и Y, или плотностью распределения случайного вектора (X, Y).

Так же как и в одномерном случае, будем предполагать, что непрерывная (или непрерывная за исключением отдельных точек или линий) функция по обоим аргументам. Тогда в соответствии с определением непрерывной случайной величины и теоремой о дифференцировании интеграла с переменным верхним пределом совместная плотность распределения представляет собой (в точках ее непрерывности) вторую смешанную производную совместной функции распределения:

Теорема. Двумерная плотность распределения обладает следующими свойствами:

l) 2)

3)

4)

5) ; 6)

7) ; 8)

Доказательство. Свойства 15 аналогичны свойствам одномерной плотности распределения. Свойство 6 является обобщением свойства 2.

Докажем утверждения 7 и 8. Из свойства 7 двумерной функции распределения и определения двумерной плотности распределения вытекает:

откуда, дифференцируя интегралы по переменному верхнему пределу, получаем утверждение 7 для одномерных (частных, маргинальных) плотностей распределения рX(х) и pY(y) случайных величин X и Y.

Определение. Случайные величины X и Y называют независимыми, если совместная функция распределения FX,Y(х, у) является произведением одномерных функций распределения FX(x) и FY(y): FX,Y(х, у) = FX(x)FY(y). В противном случае случайные величины называют зависимыми.

Теорема. Для того чтобы непрерывные случайные величины X и Y были независимыми, необходимо и достаточно, чтобы для всех х и у pX,Y(х, у) = pX(x)pY(y).

Доказательство. Пусть случайные величины X и Y независимые. Тогда, согласно определению, FX,Y(х, у) = FX(x)FY(y). С учетом свойств совместной плотности распределения имеем

Тем самым необходимость утверждения доказана.

Для доказательства достаточности следует воспользоваться определением двумерной плотности распределения и определением независимости случайных величин

Теорема. Дискретные случайные величины X и Y являются независимыми тогда и только тогда, когда для всех возможных значений xi и yi:

Определение. Ковариацией (корреляционным моментом) cov(X1, X2) случайных величин X1 и X2 называют математическое ожидание произведения случайных величин и

Для дискретных случайных величин X1 и X2

для непрерывных случайных величин X1 и X2

Полезное равенство для произвольных случайных величин

Теорема. Ковариация имеет следующие свойства.

1. cov(X, X) = DX.

2. cov(X1, X2) = 0 для независимых случайных величин X1 и X2.

3. Если Y1 = a1X1 + b1 и Y2 = a2X2 + b2, то cov(Y1, Y2) = a1a2cov(X1, X2).

4. .

5. Равенство верно тогда и только тогда, когда случайные величины X1 и X2 связаны линейной зависимостью, т.е. существуют такие числа a и b, при которых X2 = aX1 + b.

6. cov(X1, X2) = M(X1X2)  MX1MX2.

Доказательство. 1) Утверждение вытекает из очевидного соотношения cov(X, X) = М(Х  MX)2.

2) Если случайные величины Х1 и Х2 являются независимыми (и имеют математические ожидания), то

cov(X1, X2) = M((X1  МХ1)(Х2  МХ2)) = (M(X1  МХ1))(M(Х2  МХ2)),

откуда приходим к утверждению 2.

3) Пусть Y = a1X1 + b, Y2 = a2X2 + b2. Тогда

4) Рассмотрим дисперсию случайной величины Yx = xX1  X2, где х произвольное число. В силу свойств дисперсии и свойства 3 ковариации

Дисперсия DYx, как функции от х, представляет собой квадратный трехчлен. Но дисперсия любой случайной величины не может быть меньше нуля, а это означает, что дискриминант D = (2cov(X1, X2))2  4DX1DX2 квадратного трехчлена DYx является неположительным.

5) Пусть выполнено равенство . Значит, дискриминант D равен нулю, и уравнение DYx = 0 имеет решение, которое обозначим а. Тогда случайная величина Ya = аХ1  X2 принимает всего одно значение (допустим, b), и, следовательно,

Х2 = аХ1  b, т.е. случайные величины X1 и X2 связаны линейной зависимостью.

Наоборот, пусть X2 = aX1 + b. Тогда в соответствии со свойством 1 дисперсии DYa = 0, а значит, дискриминант D является неотрицательным. Поскольку при доказательстве утверждения 4 было показано, что этот дискриминант неположителен, то он равен нулю, откуда следует, что

6) Раскрывая скобки в формуле, определяющей ковариацию, и используя свойства математического ожидания, получаем требуемое.

Определение. Случайные величины X и Y называют некоррелированными, если их ковариация равна нулю, т.е. cov(Х, Y) = 0.

Определение. Коэффициентом корреляции случайных величин X и Y называют число  = (X, Y), определяемое равенством (предполагается, что DX > 0 и DY > 0)

Теорема. Коэффициент корреляции имеет следующие свойства.

1. (X, X) = 1.

2. Если случайные величины X и Y являются независимыми (и существуют DX > 0 и DY > 0), то (X, Y) = 0.

3. (a1X1 + b1, a2X2 + b2) = ±(X1, X2) При этом знак плюс нужно брать в том случае, когда а1 и а2 имеют одинаковые знаки, и минус в противном случае.

4. 1  (X, Y)  1.

5. |(X, Y)| = 1 тогда и только тогда, когда случайные величины X и Y связаны линейной зависимостью.

Условные распределения

В случае дискретной СВ закон распределения двумерного случайного вектора (X, Y) удобно задавать набором вероятностей pij = P{X = xi, Y = yj} для всех значений i и j. Зная вероятности pij, нетрудно найти законы распределений каждой из координат по формулам

,

Определение. Для двумерной дискретной случайной величины (X, Y) условной вероятностью ij, i = 1, ..., n, j = 1, ..., m, того, что случайная величина X примет значение xi при условии Y = yj, называют условную вероятность события {X = xi} при условии события {Y = yj} т.е.

При каждом j, j = 1, ..., m, набор вероятностей ij, i = 1, ..., n, определяет, с какими вероятностями случайная величина X принимает различные значения хi, если известно, что случайная величина Y приняла значение yj. Иными словами, набор вероятностей ij, i = 1, ..., n, характеризует условное распределение дискретной случайной величины X при условии Y = уj.

Аналогично определяют условную вероятность того, что случайная величина Y примет значение yj при условии X = хi.

X1

X2

0

1

PX1

0

q

q

q

1

p

p

p

PX2

q

p

Пример 1. Условное распределение числа Х1 успехов в первом испытании по схеме Бернулли при условии, что число успехов во втором испытании X2 = j, j = 0, 1, задается таблицей. Из этой таблицы следует, что, независимо от числа успехов во втором испытании, 0 или 1 успех в первом испытании происходит с одними и теми же вероятностями р и q. Это очевидно, поскольку испытания по схеме Бернулли являются независимыми.

Пример 2. Условное распределение случайной величины X (числа очков, выпавших на верхней грани игральной кости) при условии Y = yj (числа очков, выпавших на нижней грани игральной кости), j = 1, ..., 6, представлено в таблице. Действительно, если, например, на нижней грани выпало одно очко, то на верхней грани может выпасть только шесть очков (61 = 1).

X

Y

1

2

3

4

5

6

РX

1

0

0

0

0

0

1

1/6

2

0

0

0

0

1

0

1/6

3

0

0

0

1

0

0

1/6

4

0

0

1

0

0

0

1/6

5

0

1

0

0

0

0

1/6

6

1

0

0

0

0

0

1/6

PY

1/6

1/6

1/6

1/6

1/6

1/6

Перейдем к случаю, когда двумерный случайный вектор (X, Y) имеет непрерывную совместную плотность распределения р(х, у) и непрерывные маргинальные плотности распределения

,

Условная функция распределения

Определение. Условной плотностью распределения случайной величины X (случайной величины Y), являющейся координатой двумерного случайного вектора (X, Y), при условии, что другая его координата приняла некоторое фиксированное значение у (значение x), т.е. Y = y (X = x), называют функцию рX(x|у) (рY(y|x)) определяемую соотношением

Критерий независимости случайных величин X и Y. Случайные величины X и Y являются независимыми тогда и только тогда, когда условное распределение (функция распределения, плотность распределения) случайной величины X при условии Y = у совпадает с безусловным распределением (функцией распределения, плотностью распределения) случайной величины X.

Определение. Для дискретной двумерной случайной величины (X, Y) значением М(Х | Y = yj) условного математического ожидания дискретной случайной величины X при условии Y = yj, называют число

Определение. Условным математическим ожиданием М(Х|Y) дискретной случайной величины X относительно дискретной случайной величины Y называют функцию M(X | Y) = g(Y) от случайной величины Y, где область определения функции g(у) совпадает с множеством значений y1, ..., ym случайной величины Y, а каждому значению yj аргумента у поставлено в соответствие число g(уj) = М(Х | уj).

Подчеркнем еще раз, что условное математическое ожидание М(X|Y) является функцией от случайной величины, т.е. также случайной величиной.

Пример 3. Найдем условное математическое ожидание М(Х|Y) случайной величины X числа очков, выпавших на верхней грани игральной кости, относительно случайной величины Y числа очков, выпавших на нижней грани (см. пример 2). В соответствии с таблицей

Полученный результат в терминах условного математического ожидания можно записать в виде М(Х|Y) = 7  Y.

Теорема. Условное математическое ожидание M(Х|Y) обладает следующими свойствами.

1. М(с|Y) = с.

2. M(aX + b|Y) = aM(X|Y) + b.

3. M(X1 + X2|Y) = M(X1|Y) + M(X2|Y).

4. Пусть случайные величины Х1 и Х2 являются независимыми при условии, что случайная величина Y приняла любое конкретное значение. Тогда M(X1X2|Y) = M(X1|Y)M(X2|Y).

5. MX = M(M(X|Y)).

6. Пусть и(Х) и v(Y) функции от случайных величин X и Y. Тогда M(u(X)v(Y)|Y) = v(Y)M(u(X)|Y).

7. Если X и Y независимые случайные величины, то М(X|Y) = MX.

Определение. Для непрерывной двумерной случайной величины (X, Y) значением М(Х|у) = M(Х|Y = y) условного математического ожидания непрерывной случайной величины X при условии Y = у называют число

Определение. Для непрерывной двумерной случайной величины (X, Y) условным математическим ожиданием M(X|Y) непрерывной случайной величины X относительно случайной величины Y называют функцию g(Y) = М(Х|Y) от случайной величины Y, принимающую значение g(у) = М(X|у) при Y = у.

Определение. Функцию g(у) называют функцией регрессии, или просто регрессией, случайной величины X на случайную величину Y, а ее график линией регрессии случайной величины X на случайную величину Y, или просто X на Y.

Линия регрессии графически изображает зависимость „в среднем" случайной величины X от значения случайной величины Y.

Закон больших чисел и центральная предельная теорема

С самого начала изучения курса теории вероятностей мы говорили о том, что практическое применение методов этой математической дисциплины основывается на законе предельного постоянства частоты события.

Закон предельного постоянства частоты события установлен эмпирически. В соответствии с этим законом повторение одного и того же опыта приводит к тому, что частота появления конкретного случайного события теряет свойства случайности и приближается к некоторому пределу, который в соответствии со статистическим определением вероятности и называют вероятностью.

Однако для того чтобы теория согласовывалась с практикой, при аксиоматическом определении вероятности, которое мы использовали, этот закон предельного постоянства частоты должен быть обоснован теоретически. Иначе говоря, он должен быть сформулирован и доказан в виде одной или нескольких теорем. В теории вероятностей теоремы такого типа обычно называют различными формами закона больших чисел, которые, в частности, поясняют смысл математического ожидания случайной величины, и то, почему его называют также средним значением. Центральная предельная теорема, в свою очередь, объясняет то широкое распространение, которое получило на практике нормальное распределение.

Определение. Последовательность Х1, Х2, ..., Xn, ... случайных величин удовлетворяет закону больших чисел (слабому), если для любого  > 0

Иными словами, выполнение закона больших чисел отражает предельную устойчивость средних арифметических случайных величин: при большом числе испытаний они практически перестают быть случайными и совпадают со своими средними значениями.

Теорема. Если последовательность Х1, Х2, ..., Xn, ... независимых случайных величин такова, что существуют MXi = mi и DXi = i, причем дисперсии ограничены в совокупности (т.е. ), то для последовательности Х1, Х2, ..., Xn, ... выполнен закон больших чисел.

При этом говорят также, что к последовательности Х1, Х2, ..., Xn, ... случайных величин применим закон больших чисел в форме Чебышева.

,

,

Следствие. Если случайные величины Хi, i = 1, 2, ..., в условиях предыдущей теоремы являются также одинаково распределенными (в этом случае mi = m и ), то последовательность Х1, Х2, ..., Xn, ... случайных величин удовлетворяет закону больших чисел в следующей форме:

Теорема. (центральная предельная теорема). Пусть X1, X2, ..., Xn, ... последовательность независимых одинаково распределенных случайных величин, MXn = m, DXn = 2. Тогда

где Ф(х) функция стандартного нормального распределения.

Двумерные и многомерные случайные величины