Большая советская энциклопедия (БСЭ)
Малые выборки

В начало энциклопедии

По первой букве
0-9 A-Z А Б В Г Д Е Ж З И Й К Л М Н О П Р С Т У Ф Х Ц Ч Ш Щ Ъ Ы Ь Э Ю Я

Малые выборки

Малые выборки - статистические выборки столь малого объёма n, что к ним нельзя применить простые классические формулы, действующие лишь асимптотически при n → ∞. Особенности статистической оценки параметров по М. в. легче всего понять на примере нормального распределения (См. Нормальное распределение) (для которого малыми обычно считают выборки объёма n ≤ 30). Пусть необходимо оценить неизвестное среднее значение a выборки x1, x2, ..., xn из нормальной совокупности с неизвестной дисперсией σ2. Обозначим

Большая советская энциклопедия (БСЭ) Малые выборки

,

Большая советская энциклопедия (БСЭ) Малые выборки

.

Исходным пунктом при оценке a служит то обстоятельство, что распределение вероятностей величины

Малые выборки

не зависит от а и σ.

Вероятность ω неравенства - tω < t < tω и равносильного ему неравенства

Большая советская энциклопедия (БСЭ) Малые выборки

(1)

вычисляется при этом по формуле

ω = Малые выборки(2)

где s(t, n - 1) есть плотность вероятности для так называемого Стьюдента распределения (См. Стьюдента распределение) с n - 1 степенями свободы. Определяя для заданных n и ω (0 < ω < 1) соответствующее tω (что можно сделать, например, по таблицам), получают правило (1) нахождения доверительных границ (См. Доверительные границы) для величины а, имеющей Значимости уровень ω.

При больших n формула (2), связывающая ω и tω, приближённо может быть заменена формулой

Большая советская энциклопедия (БСЭ) Малые выборки

(3)

Эту формулу иногда неправильно применяют для определения tω при небольших n, что приводит к грубым ошибкам. Так, для ω = 0,99 по формуле (3) находим t0,99 = 2,58; истинные значения t0,99 для малых n приведены в следующей таблице:

------------------------------------------------------------------------------------------------------------------

| n          | 2          | 3          | 4          | 5          | 10        | 20        | 30         |

|----------------------------------------------------------------------------------------------------------------|

| t0,99       | 63,66    | 9,92      | 5,84      | 4,60      | 3,25      | 2,86      | 2,76      |

------------------------------------------------------------------------------------------------------------------

Если пользоваться формулой (3) при n = 5, то получится вывод, что неравенство

выполняется с вероятностью 0,99. В действительности в случае пяти наблюдений вероятность этого неравенства равна лишь 0,94, а вероятностью 0,99 обладает в соответствии с приведённой таблицей неравенство

выполняется с вероятностью 0,99. В действительности в случае пяти наблюдений вероятность этого неравенства равна лишь 0,94, а вероятностью 0,99 обладает в соответствии с приведённой таблицей неравенство

Малые выборки

Об оценке по М. в. теоретической дисперсии σ2 см. «Хи-квадрат» распределение (См. Хи-квадрат распределение). Разработаны также аналогичные методы оценки по М. в. параметров многомерных распределении (например, коэффициента корреляции).

Лит.: Крамер Г., Математические методы статистики, перевод с английского, М., 1948; Колмогоров А. Н., Определение центра рассеивания и меры точности по ограниченному числу наблюдений, «Известия АН СССР. Серия математическая», 1942, т. 6, № 1-2; Большев Л. Н., Смирнов Н. В., Таблицы математической статистики, М., 1965.

Ю. В. Прохоров.

В начало энциклопедии