Статистические гипотезы и их классификация. Статистический критерий
План:
- Статистические гипотезы и их классификация. Ошибки первого и второго рода.
- Статистический критерий. Критическая область и критические точки.
- Отыскание критических областей. Мощность критерия.
- Сравнение двух дисперсий нормальных генеральных совокупностей.
- Сравнение двух средних нормальных генеральных совокупностей.
Пусть требуется определить закон распределения генеральной совокупности и назовем его А. Если закон распределения неизвестен, но имеются основания предположить, что он имеет определенный вид, выдвигают гипотезу: генеральная совокупность распределена по закону А. Таким образом, в этой гипотезе речь идет о виде предполагаемого распределения.
Возможен случай, когда закон распределения известен, а его параметры неизвестны. Если есть основания предположить, что неизвестный параметр равен определенному значению , то выдвигают гипотезу: . Таким образом, в этой гипотезе речь идет о предполагаемой величине параметра одного известного распределения.
Статистической называется гипотеза о виде неизвестного распределения или гипотеза о параметрах известных распределений. Например, статистическими являются гипотезы:
- генеральная совокупность распределена по закону Пуассона;
- дисперсии двух нормальных совокупностей равны между собой.
В первой гипотезе сделано предположение о виде неизвестного распределения, во второй — о параметрах двух известных распределений.
Нулевой (основной) называется выдвинутая гипотеза .
Конкурирующей (альтернативной) называется гипотеза , которая противоречит нулевой.
Например, если нулевая гипотеза состоит в предположении, что математическое ожидание нормального распределения равно 10, то конкурирующая гипотеза может состоять в предположении, что ; т.е. :; :.
Простой называется гипотеза, содержащая только одно предположение. Например, гипотеза : математическое ожидание нормального распределения равно 3 ( известно) — простая.
Сложной называется гипотеза, которая состоит из конечного или бесконечного числа простых гипотез. Например, сложная гипотеза : состоит из бесчисленного множества простых гипотез вида :, где — любое число, большее 5.
Выдвинутая гипотеза может быть правильной или неправильной, поэтому возникает необходимость статистической (производимой статистическими методами) проверки этой гипотезы. В итоге статистической проверки гипотезы могут быть допущены ошибки.
Ошибка первого рода состоит в том, что будет отвергнута правильная гипотеза.
Ошибка второго рода состоит в том, что будет принята неправильная гипотеза.
Для проверки нулевой гипотезы используется специально подобранная случайная величина, точное или приближенное распределение которой известно. Эта случайная величина обозначается через и называется статистическим критерием (или просто критерием).
Приведем пример статистического критерия. Если проверяется гипотеза о равенстве дисперсий двух нормальных генеральных совокупностей, то в качестве критерия принимается отношение исправленных выборочных дисперсий:
.
Наблюдаемым значением называется значение критерия, вычисленное по выборкам. Например, если по двум выборкам найдены исправленные выборочные дисперсии и , то наблюдаемое значение критерия равно
.
После выбора определенного критерия множество всех его возможных значений разбивается на два непересекающихся подмножества: одно из них содержит значения критерия, при которых нулевая гипотеза отвергается, а другая — при которых она принимается.
Критической областью называется совокупность значений критерия, при которых нулевая гипотеза отвергается.
Областью принятия гипотезы (областью допустимых значений) называется совокупность значений критерия, при которых нулевая гипотеза принимается.
Поскольку критерий — одномерная случайная величина, все ее возможные значения принадлежат некоторому интервалу. Поэтому критическая область и область принятия гипотезы также являются интервалами и, следовательно, существуют точки, которые их разделяют.
Критическими точками (границами) называются точки, отделяющие критическую область от области принятия гипотезы.
Правосторонней называется критическая область, определяемая неравенством , где — положительное число (рис. 16.1).
Рис. 16.1.
Левосторонней называется критическая область, определяемая неравенством , где — отрицательное число (рис. 16.2).
Рис. 16.2.
Односторонней называется правосторонняя или левосторонняя критическая область.
Двусторонней называется критическая область, определяемая неравенствами , , где .
В частности, если критические точки симметричны относительно нуля, двусторонняя критическая область определяется неравенствами (в предположении, что ) , , или равносильным неравенством (рис. 16.3).
Рис. 16.3.
Для нахождения критической области достаточно найти критическую точку (точки). Для нахождения же такой точки задается достаточно малая вероятность — уровень значимости . Затем критическая точка ищется исходя из требования, чтобы при условии справедливости нулевой гипотезы вероятность того, что критерий примет значения из критической области, была равна принятому уровню значимости.
Например, для правосторонней критической области должно выполняться соотношение
, (16.1)
для левосторонней —
, (16.2)
а для двусторонней —
. (16.3)
Для каждого критерия имеются соответствующие таблицы, по которым и находится критическая точка, удовлетворяющая требованиям вида (16.1) – (16.3).
Если распределение критерия симметрично относительно нуля и имеются основания выбрать симметричные относительно нуля точки и (), то . Учитывая это соотношение, из (16.3) для двусторонней критической области получим соотношение
. (16.4)
Мощностью критерия называется вероятность попадания критерия в критическую область при условии, что справедлива конкурирующая гипотеза. Другими словами, мощность критерия есть вероятность того, что нулевая гипотеза будет отвергнута, если верна конкурирующая гипотеза.
Пусть для проверки гипотезы принят определенный уровень значимости, и выборка имеет фиксированный объем. Если — вероятность ошибки второго рода, т.е. события «принята нулевая гипотеза, причем справедлива конкурирующая», то мощность критерия равна .
Пусть мощность возрастает; следовательно, уменьшается вероятность совершить ошибку второго рода. Таким образом, чем мощность больше, тем меньше вероятность ошибки второго рода.
Итак, если уровень значимости уже выбран, то критическую область следует строить так, чтобы мощность критерия была максимальной. Это позволит минимизировать ошибку второго рода.
Далее нам потребуется распределение Фишера – Снедекора.
Если и — независимые случайные величины, распределенные по закону со степенями свободы и , то величина
(16.5)
имеет распределение, которое называется распределением Фишера – Снедекора со степенями свободы и .
Функция плотности этого распределения имеет вид
,
где
.
Распределение определяется двумя параметрами — числами степеней свободы и .
Пусть генеральные совокупности и распределены нормально. По независимым выборкам с объемами, соответственно равными и , извлеченным из этих совокупностей, найдены исправленные выборочные дисперсии и . Требуется по исправленным дисперсиям при заданном уровне значимости проверить нулевую гипотезу, состоящую в том, что генеральные дисперсии рассматриваемых совокупностей равны между собой:
:. (16.6)
Учитывая, что исправленные дисперсии являются несмещенными оценками генеральных дисперсий, т.е.
, ,
нулевую гипотезу можно записать так:
:. (16.7)
На практике задача сравнения дисперсий возникает, если требуется сравнить точность приборов, инструментов, самих методов измерений и т.д. Очевидно, предпочтительнее тот прибор, инструмент и метод, который обеспечивает наименьшее рассеяние результатов измерений, т.е. наименьшую дисперсию.
В качестве критерия проверки нулевой гипотезы о равенстве генеральных дисперсий принимается отношение большей исправленной дисперсии к меньшей, т.е. случайная величина
. (16.8)
Величина при условии справедливости нулевой гипотезы имеет распределение Фишера – Снедекора со степенями свободы и , где — объем выборки, по которой вычислена большая исправленная дисперсия, — объем выборки, по которой найдена меньшая исправленная дисперсия.
Критическая область строится в зависимости от вида конкурирующей гипотезы.
Первый случай. Нулевая гипотеза :. Конкурирующая гипотеза :.
В этом случае строится правосторонняя критическая область, исходя из требования, чтобы вероятность попадания критерия в эту область в предположении справедливости нулевой гипотезы была равна принятому уровню значимости:
. (16.9)
Критическая точка находится по таблице критических точек распределения Фишера – Снедекора.
Правило 1. Для того чтобы при заданном уровне значимости проверить нулевую гипотезу : о равенстве генеральных дисперсий нормальных совокупностей при конкурирующей гипотезе :, надо вычислить отношение большей исправленной дисперсии к меньшей, т.е.
, (16.10)
и по таблице критических точек распределения Фишера – Снедекора, по заданному уровню значимости и числам степеней свободы и ( — число степеней свободы большей исправленной дисперсии) найти критическую точку .
Если — нет оснований отвергнуть нулевую гипотезу. Если — нулевая гипотеза отвергается.
Пример 1. По двум независимым выборкам объемов и , извлеченным из нормальных генеральных совокупностей и , найдены исправленные выборочные дисперсии и . При уровне значимости 0,05 проверить нулевую гипотезу : о равенстве генеральных дисперсий при конкурирующей гипотезе :
Решение. Найдем отношение большей исправленной дисперсии к меньшей:
.
Конкурирующая гипотеза имеет вид , поэтому критическая область — правосторонняя.
По таблице критических точек распределения Фишера – Снедекора, по уровню значимости и числам степеней свободы и находим критическую точку .
Так как , то нет оснований отвергнуть нулевую гипотезу о равенстве генеральных дисперсий.
Второй случай. Нулевая гипотеза :. Конкурирующая гипотеза :.
В этом случае строится двусторонняя критическая область, исходя из требования, чтобы вероятность попадания критерия в эту область в предположении справедливости нулевой гипотезы была равна принятому уровню значимости .
Наибольшая мощность критерия (вероятность попадания критерия в критическую область при справедливости конкурирующей гипотезы) достигается тогда, когда вероятность попадания критерия в каждый из двух интервалов критической области равна .
Если обозначить через левую границу критической области и через — правую, то должны иметь место соотношения:
, . (16.11)
Для обеспечения попадания критерия в двустороннюю критическую область с вероятностью, равной принятому уровню значимости , в случае конкурирующей гипотезы : достаточно найти критическую точку .
Правило 2. Для того чтобы при заданном уровне значимости проверить нулевую гипотезу : о равенстве генеральных дисперсий нормальных совокупностей при конкурирующей гипотезе :, надо вычислить отношение большей исправленной дисперсии к меньшей, т.е. (16.10) и по таблице критических точек распределения Фишера – Снедекора, по заданному уровню значимости (вдвое меньшем заданного) и числам степеней свободы и ( — число степеней свободы большей исправленной дисперсии) найти критическую точку .
Если — нет оснований отвергнуть нулевую гипотезу. Если — нулевая гипотеза отвергается.
Пример 2. По двум независимым выборкам объемов и , извлеченным из нормальных генеральных совокупностей и , найдены исправленные выборочные дисперсии и . При уровне значимости 0,1 проверить нулевую гипотезу : о равенстве генеральных дисперсий при конкурирующей гипотезе :
Решение. Найдем отношение большей исправленной дисперсии к меньшей:
.
Конкурирующая гипотеза имеет вид , поэтому критическая область — двусторонняя.
По таблице критических точек распределения Фишера – Снедекора, по уровню значимости, вдвое меньшем заданного, т.е. при и числам степеней свободы и находим критическую точку .
Так как , нулевая гипотеза о равенстве генеральных дисперсий отвергается.
Пусть генеральные совокупности и распределены нормально, причем их дисперсии известны. По независимым выборкам с объемами, соответственно равными и , извлеченным из этих совокупностей, найдены выборочные средние и . Требуется по выборочным средним при заданном уровне значимости проверить нулевую гипотезу, состоящую в том, что генеральные средние (математические ожидания) рассматриваемых совокупностей равны между собой:
:. (16.12)
Учитывая, что выборочные средние являются несмещенными оценками генеральных средних, т.е.
, ,
нулевую гипотезу можно записать так:
:. (16.13)
В качестве критерия проверки нулевой гипотезы о равенстве генеральных средних принимается нормированная нормальная случайная величина
. (16.14)
Критическая область строится в зависимости от вида конкурирующей гипотезы.
Первый случай. Нулевая гипотеза :. Конкурирующая гипотеза :.
В этом случае строится двусторонняя критическая область, исходя из требования, чтобы вероятность попадания критерия в эту область в предположении справедливости нулевой гипотезы была равна принятому уровню значимости .
Поскольку распределение симметрично относительно нуля, то критические точки симметричны относительно нуля, т.е. если обозначить через правую критическую точку, то будет левой критической точкой.
Наибольшая мощность критерия (вероятность попадания критерия в критическую область при справедливости конкурирующей гипотезы) достигается тогда, когда вероятность попадания критерия в каждый из двух интервалов критической области равна :
, . (16.15)
Для того, чтобы найти правую границу двусторонней критической области, достаточно найти значение аргумента функции Лапласа, которому соответствует значение функции, равное :
. (16.16)
Обозначим значение критерия, вычисленное по данным наблюдений, через .
Если — нет оснований отвергнуть нулевую гипотезу.
Если — нулевая гипотеза отвергается.
Второй случай. Нулевая гипотеза :. Конкурирующая гипотеза :.
В этом случае строится правосторонняя критическая область, исходя из требования, чтобы вероятность попадания критерия в эту область в предположении справедливости нулевой гипотезы была равна принятому уровню значимости:
. (16.17)
Для того, чтобы найти границу правосторонней критической области, достаточно найти значение аргумента функции Лапласа, которому соответствует значение функции, равное :
. (16.18)
Обозначим значение критерия, вычисленное по данным наблюдений, через .
Если — нет оснований отвергнуть нулевую гипотезу.
Если — нулевая гипотеза отвергается.
Вопросы для повторения и контроля:
- Что вы понимаете под статистической гипотезой? Приведите примеры.
- Что такое нулевая (основная), конкурирующая (альтернативная), простая, сложная гипотезы?
- В чем состоят ошибки первого и второго рода, что называется статистическим критерием?
- Что называется наблюдаемым значением критерия, критической областью, областью принятия гипотезы (областью допустимых значений)?
- Что такое критические точки (границы), правосторонняя, левосторонняя, односторонняя, двусторонняя критическая области?
- Что называется уровнем значимости и как находится критическая область?
- Что такое мощность критерия и как она связана с ошибкой второго рода?
- Что вы знаете о распределении Фишера – Снедекора?
- Как сравниваются две дисперсии нормальных генеральных совокупностей в первом случае?
- Как сравниваются две дисперсии нормальных генеральных совокупностей в втором случае?
- Как сравниваются два средних нормальных генеральных совокупностей в первом случае?
- Как сравниваются два средних нормальных генеральных совокупностей в втором случае?
Опорные слова:
Статистическая гипотеза, нулевая (основная) гипотеза, конкурирующая (альтернативная) гипотеза, простая гипотеза, сложная гипотеза, ошибка первого рода, ошибка второго рода, статистический критерий, наблюдаемое значение критерия, критическая область, область принятия гипотезы (область допустимых значений), критические точки (границы), правосторонняя критическая область, левосторонняя критическая область, односторонняя критическая область, двусторонняя критическая область, уровень значимости, мощность критерия, распределение Фишера – Снедекора, степени свободы.