Прикладная статистика

Наука о методах обработки статистических данных и построении статистических моделей случайных явлений и процессов

Link to original

Впервые введена в 1981

Связанные науки:

Задачи прикладной статистики

  1. Описание данных
  2. Оценка данных
  3. Проверка статистических гипотез

Математическая статистика

state - государство Раздел математики, изучающий методы сбора, систематизации, обработки и интерпретации результатов наблюдений с целью выявления статистических закономерностей

Link to original

Статистика использует Аксиоматику Колмогорова

Задача статистики - имея вероятностную модель, определить ее параметры

Основные понятия математической статистики

  • Сплошное наблюдение
  • Выборочное наблюдение

Генеральная совокупность

Совокупность всех мысленных наблюдений, которые могли бы быть произведены при данном комплексе условий

Число наблюдений может быть как конечно, так и бесконечно

Link to original

Объем генеральной совокупности

Размер генеральной совокупности

Обозначается

Link to original

Выборка

Конечный набор объектов, отобранный из генеральной совокупности для изучения

Может включать всю генеральную совокупность

Link to original

Объем выборки

Размер выборки

Обозначается

Link to original

Параметр генеральной совокупности

Числовая характеристика генеральной совокупности

Обозначается

Link to original

Оценки параметров генеральной совокупности

Числовые характеристики выборки, связанной с генеральной совокупностью

Link to original

Общие сведения о выборочном методе

Репрезентативная выборка

Выборка, достаточно хорошо воспроизводящая структуру генеральной совокупности

Link to original

Случайная выборка

Выборка по генеральной совокупности, которая получается извлечением элементов из набора по одному, при том, что каждый элемент имеет равный шанс быть отобранным

Link to original

Случайная выборка чаще всего является репрезентативной

Прочие способы выборки:

  • Механический (каждый -ый из генеральной совокупности)
  • Серийный (выбираем сплошными сериями по штук )
  • По типу
    • Равномерный
    • Пропорциональный
  • По повторяемости

Ошибки, связанные с неудачно выбранной выборкой

Разделяются на 2 категории:

  • Репрезентативные
    • Систематические (нарушена случайность отбора при составлении выборки)
    • Случайные (из-за неудачной выборки, несмотря на ее случайный характер)
  • Регистрационные (при фиксации данных допустили неточность)

Вариационный ряд и его числовые характеристики

Ранжирование опытных данных

Расположение выборки в порядке неубывания

Link to original

Вариант

Разобьем элементы выборки на группы по признаку, что элементы группы имеют одно значение. Из каждой группы выберем элемент-представитель. Значение элемента-представителя называется вариантом

Обозначается

Link to original

Частота варианта

Число элементов в каждой группе называется частотой варианта

Обозначается

Link to original

Очевидно, что сумма частот всех вариантов выборки дает объем выборки

Относительная частота варианта

частота варианта, деленная на объем выборки

Обозначается

Расширяется при определении интервального вариационного ряда

Link to original

Накопительная частота

Классическое определение

Пусть - вариант какой-то выборки. Накопительной частотой называется сумма частот всех вариантов меньших или равных

Обозначается

Рекурентное определение

Упорядочим варианты выборки по возрастанию. Накопительная частота варианта совпадает с его частотой . Накопительная частота варианта вычисляется по формуле

где - частота варианта

Link to original

Относительная накопительная частота

Пусть в выборке объема рассчитана накопительная частота . Тогда относительной накопительной частотой называется величина

Расширяется при определении интервального вариационного ряда

Link to original

Дискретный вариационный ряд

Дискретный вариационный ряд

Последовательность упорядоченных по неубыванию вариантов выборки вместе со своими частотами или относительными частотами.

Записывается как последовательность двумерхных точек или соответственно

Link to original

Интервальный вариационный ряд

Если изучаемая случайная величина непрерывна (принимает значения из интервала), то строят интервальный вариационный ряд. Определение конструктивное

Построение интервального вариационного ряда

Положим варианты исследуемой величины принимают значения из отрезка

Расчет числа полуинтервалов , на которые нужно разбить

Обычно принимает значения от 7 до 12. Вычисляется по формуле Стёрджеса

Расчет длины частичных полуинтервалов

Для этого находим размах

Размах

Разность между максимальным и минимальным вариантами выборки

Обозначается

Link to original

и вычисляем длину полуинтервалов по формуле:

Разбитие отрезка на полуинтервалы длины

Разбиваем отрезок на вычисленные полуинтервалы известным способом

Корректировка числа полуинтервалов

После разбития может получится, что варианты с значениями не попадут ни в один полуинтервал, на которые разбили отрезок

В таком случае берем отрезок и разбиваем его на полуинтервал, каждый длины . Все варианты из исходного отрезка попадут в по-новому построенные полуинтервалы разбиения. Считаем эти полуинтервалы полуинтервалами разбиения отрезка

Ранжирование полуинтервалов по возрастанию

Ранжируем полуинтервалы по возрастанию. Далее называем их частичными интервалами

Расчет числа элементов, принадлежащих каждому частичному интервалу

Для каждого частичного интервала считаем число элементов выборки , которые попали в этот -ый интервал, или соответствующие частости (определение естественно расширяется) по формуле

Интервальный вариационный ряд

Упорядоченный набор частичных интервалов с соответствующими частотами или частостями

Link to original

Графическое представление выборки

Представление дискретного ряда

Дискретный вариационный ряд можно представить в виде полигона частот

Полигон частот

Графическое представление дискретного вариационного ряда в виде ломанной, соединяющей точки

Link to original

Или в виде относительного полигона частот

Относительнй полигон частот

Графическое представление дискретного вариационного ряда в виде ломанной, соединяющей точки

Link to original

Представление Интервального ряда

Интервальный вариационный ряд можно графически представить в виде гистограммы частот

Гистограмма частот

Графическое представление интервального вариационного ряда. Строится откладыванием на оси абсцисс соответствующих частичных интервалов. На -ом интервале строится прямоугольник высоты

Link to original

Представление накопительных частостей

Накопленную частость можно графически представить в виде коммулятивной кривой (кумулянты)