Дисперсия определяется для случайной величины и обозначается как D(X). Величина дисперсии находится исходя из формулы:
$D(X)=M[(X-M[x])^2]$
Оценка вероятности появления события, а также оценка его наиболее часто получающегося результата недостаточны, чтобы сделать полноценный прогноз или провести анализ. Чтобы получить больше информации при проведении экспериментов, необходимо уметь оценивать меру расхождения случайной величины и её матожидания. Такой мерой и является параметр под названием дисперсия. Также он называется стандартным или среднеквадратическим отклонением.
Определение 1
Дисперсия определяется для случайной величины и обозначается как D(X). Величина дисперсии находится исходя из формулы:
$D(X)=M[(X-M[x])^2]$
Здесь, в формуле, M – это матожидание случайной величины Х, существующей в некотором вероятностном пространстве. Значение дисперсии определяется как то, что она представляет собой математическое ожидание отклонения, возведённого в квадрат. Под отклонением подразумевается отклонение случайной величины от её математического ожидания.
Определение 2
Существует также ещё один параметр, применяемый в данном разделе теории вероятностей. Это среднее квадратическое отклонение случайной величины. Его принимают равным квадратному корню из дисперсии и вычисляют как:
$\sigma(X)=\sqrt{D(X)}$
Пример 1
Предположим существует некоторая случайная величина Х. Её закон распределения представлен следующим образом:
Тогда матожидание величины может быть вычислено следующим образом:
$M(X)=1 \cdot \frac{1}{6}+2 \cdot \frac{1}{2}+2 \cdot \frac{1}{3}= \frac{13}{6}$
Чтобы вычислить дисперсию, запишем распределение для отклонения случайной величины от её матожидания, а также для квадрата этого отклонения:
Х-М(Х)= $-\frac{7}{6}$, Р= $\frac{1}{6}$.
Х-М(Х)= $-\frac{1}{6}$, Р=$\frac{1}{2}$.
Х-М(Х)= $\frac{5}{6}$, Р=$\frac{1}{3}$.
$(X-M(X))^2$=$\frac{49}{36}$, P=$\frac{1}{6}$.
$(X-M(X))^2$=$\frac{1}{36}$, P=$\frac{1}{2}$.
$(X-M(X))^2$=$\frac{25}{36}$, P=$\frac{1}{3}$.
Зная приведённые выше значения легко вычислим величину дисперсии:
$D(X)= \frac{49}{36} \cdot \frac{1}{6} + \frac{1}{36} \cdot \frac{1}{2} + \frac{25}{36} \cdot \frac{1}{3} = \frac{17}{36}$
Теорема 1
Чтобы вычислить значение дисперсии, можно вычесть матожидание, возведённое в квадрат, из матожидания от квадрата случайной величины
$D(X)=M(X^2)- M^2(X)$
Доказательство
Зная, что M(X), $2M(X)$, $M^2(X)$ являются постоянными, а также зная свойства матожидания, а именно то, что постоянный множитель матожидания можно вынести за знак, а также то, что матожидание суммы равняется сумме матожиданий, преобразовываем первоначальное выражение, взятое из определения дисперсии.
$D(X)=M(X-M(X))^2=M(X^2-2XM(X)+M^2(X))=M(X^2)-2M(X)M(X)+M^2(X)=M(X^2)-2M^2(X) + M^2(X) = M(X^2) - M^2(X) $
В итоге получаем искомое выражение:
$D(X)=M(X^2)-M^2(X)$
Свойство 1
Дисперсия вычисленная от постоянной величины будет равняться нулю.
D(C)=0
Свойство 2
Если под знаком дисперсии есть постоянный множитель, то его допустимо вынести, предварительно возведя в квадрат.
$D(СX)=С^2D(X)$
Свойство 3
Если имеются две случайные величины независимые друг от друга, то будет верно утверждение, что дисперсия их суммы равняется сумме их дисперсий, а именно:
$D(X+Y)=D(X)+D(Y)$
Также из данного свойства можно вывести два следствия. Первое гласит, что дисперсия суммы нескольких случайных величины будет равняться сумме их дисперсий.
$D(X_1+X_2+…+X_n)=D(X_1)+D(X_2)+…+D(X_n)$
Другое следствие: дисперсия суммы случайной величины и постоянной будет равняться дисперсии просто случайной величины. Это следует из первого и третьего свойства дисперсии.
$D(C+X)=D(X)$
Свойство 4
Рассмотрим разность двух случайных величин. Общая дисперсия будет равна сумме их дисперсий. Это утверждение легко вывести из первого и третьего свойств.
$D(X-Y)=D(X)+D(Y)$
Пример 2
Необходимо определить дисперсию и среднеквадратическое отклонение для каждой из двух случайных величин, со следующими законами распределения:
Решение
Вычислим матожидания:
$М(Х)= -0,1 \cdot 0,1 – 0,01 \cdot 0,2 + 0 \cdot 0,4 + 0,01 \cdot 0,2 + 0,1 \cdot 0,1 = 0 $
$М(Y)= -20 \cdot 0,3 – 10 \cdot 0,1 + 0 \cdot 0,2 +10 \cdot 0,1 + 20 \cdot 0,3 = 0 $
Теперь согласно формуле вычислим дисперсии данных случайных величин:
$D(Х)= (-0,1-0)^2 \cdot 0,1 +(– 0,01-0)^2 \cdot 0,2 + (0-0)^2 \cdot 0,4 + (0,01-0)^2 \cdot 0,2 + (0,1-0)^2 \cdot 0,1 = 0,00204 $
$D(Y)= (-20-0)^2 \cdot 0,3 +(– 10-0)^2 \cdot 0,1 + (0-0)^2 \cdot 0,2 +(10-0)^2 \cdot 0,1 + (20-0)^2 \cdot 0,3 = 260 $
Теперь нетрудно определить среднеквадратическое отклонение:
$\sigma(X)=\sqrt{0,00204}\approx 0,04517$
$\sigma(Y)=\sqrt{260}\approx\ 16,1$
Согласно полученным данным становится очевидно, что среднеквадратическое отклонение Х гораздо меньше, чем среднеквадратическое отклонение Y. Аналогична и большая разница дисперсий. Это при том, что матожидание обеих величин одинаково. Подобная разница характеризуется тем, что величины отражают различные свойства закона распределения случайных величин.
Пример 3
Банк предлагает четыре альтернативных проекта, связанных с инвестированием. При этом для каждого из проектов предоставлен прогноз по прибыли
Вычислим для каждого из проектов математическое ожидание, дисперсию, а также среднеквадратическое отклонение.
Решение
Математическое ожидание:
$М(Х_1)= 500 \cdot 1 = 500 $
$М(X_2)= 1000 \cdot 0,5 + 0 \cdot 0,5 = 500 $
$М(Х_3)= 500 \cdot 0,5 + 1000 \cdot 0,25 + 0 \cdot 0,25 = 500 $
$М(X_4)= 500 \cdot 0,5 – 8500 \cdot 0,25 + 9500 \cdot 0,25 = 500 $
Определяем дисперсию:
$D(Х_1)= (500-500)^2 \cdot 1 = 0 $
$D(X_2)= (1000-500)^2 \cdot 0,5 + (0-500)^2 \cdot 0,5 = 2500 $
$D(Х_3)= (500-500)^2 \cdot 0,5 + (1000-500)^2 \cdot 0,25 + (0-500)^2 \cdot 0,25 = 1250 $
$D(X_4)= (500-500)^2 \cdot 0,5 + (-8500-500)^2 \cdot 0,25 + (9500-500)^2 \cdot 0,25 = 40 500 000 $
Теперь нетрудно определить среднеквадратическое отклонение:
$\sigma(Х_1)=\sqrt{0}\approx 0$
$\sigma(Х_2)=\sqrt{2500}\approx\ 5$
$\sigma(Х_3)=\sqrt{1250}\approx 35,36$
$\sigma(Х_4)=\sqrt{40500000}\approx\ 636$
Математическое ожидание всех инвестиционных проектов одинаковое. В данном случае это означает, что в среднем, в долгосрочной перспективе доход на каждом проекте одинаков. Среднеквадратичное же отклонение характеризует риск, с которым столкнётся инвестор. Чем выше значение, тем больше риск. Наименее рискованным будет первый проект, наиболее рискованным четвёртый.