При рассмотрении различных разделов теории вероятности непрерывно встречается такое понятие как функция распределения. Она может быть задана для разных типов случайных величин. Через её посредство задаются также и все ключевые параметры случайных величин, такие как матожидание, дисперсия среднеквадратическое отклонение и другие.

Чаще всего, при решении примеров и задач функция распределения является теоретической, а при работе в рамках матстатистики, в общем случае — неизвестной. Однако, на практике с помощью имеющейся выборки, можно создать выражение, которое будет максимально приближено к виду неизвестной функции распределения.

Чтобы определить вид такого, приближенного, выражения, вводится представление об эмпирической функции распределения (выборки). Она позволяет структурировать статистические данные, выявить необходимые закономерности, определить все нужные характеристики случайной величины.

Формулы и свойства эмпирической функции распределения

Определение 1

Для существующей выборки $x=(x_1, x_2,...x_n)$ и ряда частот, каждая из которых соответствует каждому элементу выборки, существует такая функция $F^*(x)$, которая и определяет конкретное значение частоты события для любого из компонентов выборки.

Используемая формула, для вычисления эмпирической функции распределения

$F^*(x)=\frac {n_x}{n}=\sum_{x_i<x}^{}p_i$

Здесь $n_x$ — количество наблюдений (вариантов) меньше x, n - размер выборки, х – произвольное значение величин.

Либо более общая, но абсолютно идентичная запись:

$F_n^*(t)=\frac {|i:x_i\leq t|}{n}$

Термин «эмпирическая», употреблённый в определении значит, что функция определяется по результатам опыта (эмпирического опыта), то есть, по набору значений, составленных из итогов испытаний — по выборке. Именно из-за такого принципа формирования используемых данных также применимо и другое наименование — «выборочная функция распределения».

Из определения становится ясно, что в точках рассматриваемая функция будет зависеть от значений выборки, поэтому уточненное и более точное её обозначение могло бы иметь вид: $F^*_n(t;x_1...x_n)$. Тогда в данном виде параметр t будет являться основным, а другие представляют собой фиксированные величины. Иной подход позволяет представить значения выборки x в виде независимых, а также одинаковым образом распределяемых случайных величин, для которых определена функция распределения — F. Исходя из такой интерпретации, $F^*_n(t)$ является случайной величиной. Получаем, что в пределе $n\rightarrow\infty$ функция распределения выборки обладает свойством равномерной сходимости к своему теоретическому значению:

$P(\sup_{t \in R}|F^*_n(t)-F(t)|\rightarrow 0)=1$

Данный факт представляет собой общую закономерность, которая, в свою очередь, носит наименование теорема Гливенко.

Свойство 1

Одно из свойств функции $F^*(x)$ заключается в том, что все её значения лежат в пределах интервала [0;1].

Свойство 2

$F^*(x)$- неубывающая функция.

Не трудно уловить закономерность, заключающуюся в том, что функция $F_n^*(t)$ представляет собой кусочно-постоянную, а также неубывающую и непрерывную справа функцию. В том случае, если $x_i$ различные, тогда для каждой точке $x_i$ функция получает скачок величины своего значения. В случае, когда $\frac {1}{n}$ из $x_i$ совпадают, скачки будут складываться.

Свойство 3

Если $х_1$ – наименьшая варианта, то $F^*(x)=0 при x \leq x1$.

Свойство 4

Если $х_k$ – наибольшая варианта, то $F^*(x)=1 при x > x_k$.

Примеры расчёта с таблицей и графиком

Пример 1

Пусть существует таблица, с помощью которой задана функция распределения выборки. Необходимо произвести вычисления и установить каков графический вид эмпирической функции распределения

Xi	2	3	4	5	6
Ni	4	10	6	8	7	5

Решение

Из таблицы n=40, т.е. n=4+10+6+8+7+5=40

Вычислим функцию распределения выборки

$F_{40}(x\leq1)=\frac{0}{40}=0$

$F_{40}(1< x\leq2)=\frac{0+4}{40}=0.1$

$F_{40}(2< x\leq3)=\frac{4+10}{40}=0,35$

$F_{40}(3< x\leq4)=\frac{4+10+6}{40}=0,5$

$F_{40}(4< x\leq5)=\frac{4+10+6+8}{40}=0,7$

$F_{40}(5< x\leq6)=\frac{4+10+6+8+7}{40}=0,875$

$F_{40}(x>6)=\frac{4+10+6+8+7+5}{40}=1$

Для эмпирической функции распределения $F_n(x)$ можно записать её значения в интервалах:

0, если $ x\leq1$,

0,1, если $ 1< x\leq2$,

0,35, если $ 2< x\leq3$,

0,5, если $ 3< x\leq4$,

0,7, если $ 4< x\leq5$,

0,875, если $ 5< x\leq6$,

1, если $ x>6$.

Изобразим на графике внешний вид кусочно-постоянной эмпирической функции распределения

Warning: file_put_contents(./students_count.txt): failed to open stream: Permission denied in /var/www/webmath-q2ws/data/www/webmath.ru/poleznoe/guide_content_banner.php on line 20

236

проверенных автора готовы помочь в написании работы любой сложности

Мы помогли уже 4 451 ученикам и студентам сдать работы от решения задач до дипломных на отлично! Узнай стоимость своей работы за 15 минут!

Пример 2

Требуется нарисовать график для эмпирической функции, если известно распределение выборки.

Решение

Рассчитаем размер выборки: n = 10 + 15 + 25 = 50. Значение самой маленькой варианты составляет 2. Тогда имеем F*(X) = 0 при Х ≤ 2. При этом случай Х < 4 (или X1 = 2) наблюдался 10 раз, значит, F*(X) = 10/50 = 0,2 при 2 < Х < 4. Значения X < 6 (а именно X1 = 2 и X2 = 4) наблюдались 10 + 15 = 25 раз, значит, при 4 < Х < 6 функция F*(X) = 25/50 = 0,5. Поскольку X = 6 — максимальная варианта, то F*(X) = 1 при Х > 6. Далее выведем формулу той самой эмпирической функции, которую требуется найти.

График этой функции показан на следующем рисунке:

Теорема умножения вероятностей

Теорема сложения вероятностей

Формула Байеса

Противоположные события

Эмпирическая функция распределения

Формулы и свойства эмпирической функции распределения

Примеры расчёта с таблицей и графиком

Все еще сложно?