Теория:

В статистике исследуют различные совокупности данных — числовых значений случайных величин с учётом частот, с которыми они встречаются в совокупности.

При этом совокупность всех данных называют генеральной совокупностью, а любую выбранную из неё часть — выборкой.

В статистических исследованиях выборку называют репрезентативной, если в ней присутствуют те и только те значения случайной величины, что и в генеральной совокупности, причём частоты имеющихся в ней данных находятся практически в тех же отношениях, что и в генеральной совокупности.

Совокупность данных иногда бывает полезно охарактеризовать (оценить) одним числом — мерой центральной тенденции числовых значений её элементов. К таким характеристикам относятся мода, медиана и среднее.

Мода (обозначают Mo) — это значение случайной величины, имеющее наибольшую частоту в рассматриваемой выборке.

Пример:

мода выборки \(7\), \(6\), \(2\), \(5\), \(6\), \(1\) равна \(6\);

a выборка \(2\), \(3\), \(8\), \(2\), \(8\), \(5\) имеет две моды: Mo \(= 2\),  Mo \(= 8\).

Медиана (обозначают Me) — это число (значение случайной величины), разделяющее упорядоченную выборку на две равные по количеству данных части.
 
Если в упорядоченной выборке нечётное количество данных, то медиана равна серединному из них. Если в упорядоченной выборке чётное количество данных, то медиана равна среднему арифметическому двух серединных чисел.
Пример:

1) \(5\), \(9\), \(1\), \(4\), \(5\), \(-2\), \(0\);   2) \(7\), \(4\), \(2\), \(3\), \(6\), \(1\).

1. Расположим элементы выборки в порядке возрастания: \(-2\), \(0\), \(1\), \(4\), \(5\), \(5\), \(9\). Количество данных нечётно. Слева и справа от числа \(4\) находятся по \(3\) элемента, т. е. \(4\) — серединное число выборки, поэтому Me \(= 4\).

2. Упорядочим элементы выборки: \(1\), \(2\), \(3\), \(4\), \(6\), \(7\).

Количество данных чётно. Серединные данные выборки: \(3\) и \(4\) — поэтому Me=3+42=3,5.

Среднее (или среднее арифметическое) выборки — это число, равное отношению суммы всех чисел выборки к их количеству.

Если рассматривается совокупность значений случайной величины X, то её среднее обозначают X¯.

Пример:

найти среднее выборки значений случайной величины X, распределение которых по частотам представлено в таблице:

\(X\)
\(2\)
\(3\)
\(4\)
\(8\)
\(10\)
\(M\)
\(1\)
\(2\)
\(3\)
\(1\)
\(1\)
 
X¯=21+32+43+81+1011+2+3+1+1=388=4,75.

 

Одной из наиболее распространённых характеристик выборки значений случайной величины, чьё распределение по вероятностям известно, является так называемое математическое ожидание.

Пусть распределение по вероятностям \(P\) значений некоторой случайной величины X задано таблицей.

X
X1
X2
\(...\)
Xn1
Xn
P
P1
P2
\(...\)
Pn1
Pn
 
Тогда число E, где E=X1P1+X2P2+...+Xn1Pn1+XnPn, называют математическим ожиданием (или средним значением) случайной величины X.