Теория:

Статистические данные, как правило, представляют собой данные какого-либо конкретного измерения, проведённого в реальности, а при вычислении вероятностей случайных событий мы имеем дело с той или иной моделью реальности. Как же связаны между собой реальность и модель реальности? Насколько точно наши теоретические представления об окружающем мире соответствуют тому, что происходит на практике? Ответ кроется в следующим определении:

При неограниченном увеличении числа независимых повторений одного и того же опыта в неизменных условиях практически достоверно, что частота появления фиксированного случайного события сближается с некоторым постоянным числом. Это явление называют статистической устойчивостью, а указанное число — статистической вероятностью события.

Для каждого конкретного числа повторений опыта частота появления события скорее всего отличается от вероятности события.

Явление статистической устойчивости гарантирует лишь, что с увеличением числа повторений опыта вероятность заметного отличия частоты события от его вероятности стремится к нулю. Такая устойчивость имеет место, например, для подбрасывания монетки, для вытаскивания карт, выпадения определённого числа очков на игральных кубиках, определения среднесуточной температуры и вообще для большинства случайных событий.

Явление статистической устойчивости соединяет реально проводимые, эмпирические испытания с теоретическими моделями этих испытаний.

Пример:

У каждого автора есть своя частотная таблица использования букв, слов, специфических литературных оборотов и т. п. По этой частотной таблице можно определять автора примерно так же, как и по отпечаткам пальцев.

Вот пример из нашей недавней истории. До сегодняшнего дня не утихают споры об авторстве «Тихого Дона». Многие считают, что в 23 года такую глубокую и воистину великую книгу М. А. Шолохов написать просто не мог. Выдвигались разные аргументы и разные кандидаты в авторы. Особенно жаркими были споры в момент присуждения ему Нобелевской премии по литературе (1965). Статистический анализ текстов и сличение с текстами, где авторство М. А. Шолохова не вызывало сомнений, подтвердили всё же гипотезу о нём как об истинном авторе «Тихого Дона».

Статистическая устойчивость означает, что при проведении большого числа повторений испытания подсчитанная частота практически совпадет с неизвестной нам вероятностью наступления события A . Значит, найденная частота приблизительно равна вероятности события A .

Следует только точно понимать, что частоту наступления мы подсчитываем для реальных событий, а вероятность — для теоретической модели этих событий.

Относительной частотой события называют отношение числа испытаний, в которых событие появилось, к общему числу практически произведенных испытаний. Таким образом, относительная частота события \(A\) определяется формулой: W(A)=mn, где \(m\) — число появлений события, \(n\) — общее число испытаний.

Число, к которому стремится устойчивая относительная частота, называется статистической вероятностью этого события: P(A)W(A)