Статистические гипотезы. Основная и конкурирующая гипотезы. Критерий, допустимая и критическая области, статистика критерия. Уровень значимости и мощность критерия. Критерии для проверки гипотез о параметрах нормального закона. Критерий согласия хи-квадра

Территория рекламы

Лекция 8. Статистические гипотезы. Основная и конкурирующая гипотезы. Критерий, допустимая и критическая области, статистика критерия. Уровень значимости и мощность критерия. Критерии для проверки гипотез о параметрах нормального закона. Критерий согласия хи-квадрат.

Определение. Статистической гипотезой H называют любое утверждение относительно функции распределения F(х) некоторой случайной величины x, касающееся типа функции распределения, значения ее параметров, квантилей и т.д.

Гипотезы H проверяют путем сопоставления выдвинутых предположений с результатами эксперимента, который в статистике представляет собой n независимых наблюдений над случайной величиной x, т.е. выборку , где xn − независимые одинаково распределенные случайные величин, каждая с функцией распределения F(x).

Статистические гипотезы бывает двух видов: а) параметрические; б) непараметрические.

Определение. Статистическая гипотеза называется параметрической, если тип закона распределения случайной величины известен, а гипотеза выдвигается относительно параметров функции распределения.

Задача проверки параметрической гипотезы формулируется в следующем виде: известен вид плотности вероятности случайной величины , параметр же − неизвестен. Обозначив через  множество всех возможных значений параметра θ, получим параметрическую гипотезу следующего вида: , где − некоторое подмножество .

Определение. Статистическая гипотеза называется непараметрической, если заранее не известен тип функции распределения, и гипотеза состоит в том, что она принадлежит некоторому подклассу класса всех непрерывных функций распределения.

Пример 1. В ходе эксперимента наблюдается величина ξ. В зависимости от наличия априорных сведений возможны две ситуации:

а) известно, что ξ распределена по нормальному закону . Выдвигаемая гипотеза состоит в том, что

б) неизвестно заранее, к какому типу принадлежит функции распределения ξ. Выдвигаемая гипотеза состоит в том, что функция распределения является нормальной с параметрами .

В случае а) гипотеза является параметрической, причем  состоит из одной θ = (0, 1); в случае б) гипотеза является непараметрической.

Определение. Гипотезу называют простой, если ее условиям удовлетворяет единственная функция распределения F(x); в противном случае ее называет сложной.

Пример 2. Завод выпускает автомобильные двигатели со средним моторесурсом μ0 = 200000 км. Решено технологию изготовления изменить. Обозначим μ1 средний моторесурс двигателя после изменения технологии. Тогда возможны, например, следующие гипотезы:

a) H: μ0 = μ1 = 200000 км;

б) H: μ0 < μ1;

в) H: μ0 > μ1.

Все три гипотезы являются сложными. Например, гипотеза б не уточняет конкретное значение μ1; гипотеза а допускает в качестве функции распределения F(x) моторесурса x любую функцию распределения, у которой параметр μ = 200 000 км. Однако, если дополнить гипотезу а требованием, при котором случайная величина x (моторесурс двигателя) имеет экспоненциальную функцию распределения F(x) = 1 − ехр(−x/μ0), то гипотеза станет простой: имеется единственная экспоненциальная функция распределения F(x) с параметром μ0 = 200000 км.

Определение. Гипотезу, справедливость которой проверяется в ходе эксперимента, называют основной и обозначают H0 (нулевая гипотеза).

Гипотеза H0 может оказаться и неверной. В зависимости от того, какие отклонения от Н0 возможны (или интересуют экспериментатора), формулируют альтернативные (конкурирующие) гипотезы Н1. В примере 1 за основную гипотезу Н0 можно принять гипотезу а, а в качестве альтернативной − гипотезу в, так как основная проблема для любого изготовителя − не ухудшить при введении новой технологии качество изделий.

Статистические гипотезы проверяют с помощью статистических критериев.

Определение. Статистический критерий − это совокупность правил, позволяющих по полученной выборке  принять или отвергнуть ее в пользу Н1.

Естественно, любой статистический критерий основан на сравнении теоретических предположений, выдвинутых в гипотезе Н0 с результатами конкретной выборки. Для этого строится случайная величина, которая пропорциональна отклонению некоторой выборочной характеристики от предполагаемой теоретической. Нужно эту величину построить так, чтобы можно было найти ее закон распределения. Такую величину называют статистикой критерия.

Определение. Статистикой критерия проверки гипотезы Н0 называется случайная величина, зависящая от выборки, закон распределения которой известен, в предположении, что верна гипотеза Н0.

Пример 3. Пусть дана выборка  из нормальной совокупности, дисперсия которой известна и равна 4, а математическое ожидание неизвестно. Выдвигаем гипотезу Н0, состоящую в том, что математическое ожидание этого распределения μ = 1, альтернативной гипотезой будем считать, что μ ≠ 1. Известно, что оценкой математического ожидания является среднее арифметическое выборки .

Поэтому построим статистику критерия, пропорциональную разности между предполагаемым математическим ожиданием и его оценкой, которая является выборочной характеристикой, а именно: возьмем . Известно, что величина T распределена нормально с параметрами μ0 = 0, σ2 = 1 (N(0, 1)), если верна Н0.

Приведем общий принцип построения статистического критерия:

1) задают некоторую фикцию  от элементов выборки, называемую статистикой критерия;

2) множество Ω всех возможных значений T разбивают на два подмножества: T0, Tкр = Ω/T0.

3) если конкретное значение статистики  попадает в T0, то гипотезу H0 принимают; если же , то Н0 отвергают в пользу Н1.

Множества T0, Tкр  называют множеством принятия Н0 и критическим множеством соответственно.

Пример 4. Для проверки утверждения о том, что внутренний диаметр труб равен в среднем 3,5 см, естественно выдвинуть гипотезы

H0: μ = μ0 = 3,5; H1:

Измерив диаметр n труб и получив выборку , можно произвольно принять решение отвергнуть H0, если

или

В этом примере

Однако при таком подходе совершенно невозможно сделать какие-либо выводы об ошибках, присущих предложенному критерию, т.е. почему избрано , а не ? Фон Нейман и К. Пирсон предложили концепцию, устраняющую эту трудность. В силу того, что  является случайной величиной, то событие  может произойти как при справедливости H0, так и при справедливости H1. В связи с этим при проверке H0, возможны ошибки двух типов. Ошибка 1-го рода − верна Н0, принимается ; ошибка 2-го рода − верна H1, принимается . Вероятность ошибки 1-го рода обозначим , вероятность ошибки 2-го рода − .

Замечание. Необходимо подчеркнуть, что α вычисляют в предположении справедливости H0, β − в предположения справедливости H1.

Вероятность . т.е. вероятность правильно отвергнуть H0, называют мощностью критерия.

Определение. Вероятность ошибки 1-го рода α также называют размером критического множества Ткр или размером критерия.

Пример 5. Рассмотрим условие примера 4. Предположим дополнительно, что  при любом .

Тогда . Вычислим размер критерия α. Учитывая, что при Н0 , получим

где Ф0(x) − функция Лапласа.

Если n = 9, то, используя таблицы, приближенно получим

Для того чтобы зачислить величину β, необходимо знать, чему равно μ при H1. Предположим, что μ = μ1 = 3,8. Тогда

Поэтому . Как видно, вероятность ошибки 2-го рода велика.

На рисунке приведены плотности распределения  при Н0 и при H1. Очевидно, что S1 + S2 = α, S3 = β. При построении любого критерия стремятся уменьшить α и увеличить мощность  или, другими словами, уменьшить β. Однако, если объем выборки n фиксирован, нельзя одновременно уменьшить обе величины: α и β. Например, из рисунка видно, что уменьшая α за счет расширения T0, одновременно увеличиваем величину β.

В случае простых параметрических Н0 и H1 всегда можно найти критерий, обладающий оптимальными свойствами.

Определение. Наиболее мощным критерием (НМК) размера α называется критерий, для которого мощность максимальна по сравнению с мощностями любых других критериев размера α.

Пусть имеется выборка  из генеральной совокупности с плотностью f(х, θ), где θ − неизвестен. H0: θ = θ0; H1:

Определим величину , где ,  − функции правдоподобия для H0 и H1 соответственно. Величина  называется отношением правдоподобия.

Лемма (Неймана−Пирсона). Критерий, удовлетворяющий требованиям: а) статистика критерия есть величина

б) строится следующим образом:

где  таково, что  является НМК размера α для проверки H0 против H1,

Таким образом, для построения НМК необходимо уметь вычислять распределение величины .

Пример построения оптимального критерия. Построение оптимального по лемме Неймана−Пирсона для параметра μ нормального закона распределения с известной дисперсией σ2 проведем для случая двух простых гипотез H0: μ = μ 0; H1: , где μ0 и μ1 − некоторые заданные значения, связанные неравенством μ0 < μ1. В рассматриваемом случае функция правдоподобия имеет вид

а отношение правдоподобия

В данном случае неравенство  равносильно неравенству , где константу С выбирают из условия обеспечения заданного уровня значимости α:

Таким образом, константа С, задающая критическую область в, определяется равенством . При этом вероятность совершения ошибки второго рода

является минимально возможной при данном значении α.

Замечание. Можно показать, что если μ0 > μ1, то .

На практике поступают следующем образом, фиксируют некоторое значение α (обычно α = 0,1; 0,05; 0,01), и из всех критериев размера α выбирают критерий с наименьшим β. Если Н0, H1 простые гипотезы, то такой оптимальный критерий строят на основе леммы Неймана−Пирсона.

Если критерий таков, что критическими являются как малые, так и большие значения его статистики , то его называют двусторонним. В примере 5 рассмотрен именно двусторонний критерий. Если же критическими являются только большие значения  (или только малые), то такой критерий называют односторонним. Выбор двустороннего или одностороннего критерия определяется видом альтернативной гипотезы H1.

Пример 6. Рассмотрим условие примера 4. Предположим, что изготовитель делает трубы из дорогого металла. Тогда при проверке H0: μ = μ0 = 3.5 его в первую очередь будут интересовать отклонения от H0 вида H1: μ = μ1 > 3.5, так как в этом случае увеличивается расход металла. Как построить Tкр? Выбрав значение α, отвергнем гипотезу H0, если  принимает большие значения, т.е. . Константу с определим из условия , обеспечивая заданный размер критерия. Если α = 0.05, то получим при n = 9

Тогда

,

где  − квантиль уровня 0,95 распределения N(0, 1).

Учитывая, что , получим с = 3,5 + 0,44 = 3,94. Таким образом, . В связи с тем, что H1: μ = μ1 > 3.5 − сложная гипотеза, то при разных значениях  будут иметь место различные значения. Отсюда следует, что невозможно определить β сразу для всех . (В примере 3 мы обошли эту трудность, заменив Н1, на простую гипотезу H1: μ = μ1 = 3.8) Это обстоятельство имеет общий характер при проверке гипотез для сложных H1. В ряде практических задач гипотеза H1 "отделена" от H0 ненулевым "расстоянием". Например, при H0: μ = μ0 альтернатива H1 имеет вид

Будем рассматривать такие критерия, при которых вероятность попасть в критическую область Tкр увеличивается с удалением μ1 от μ0 . Тогда можно вычислить минимально возможную мощность критерия, равную  и получаемую при минимальном расстоянии H1 от H0. Множество, "отделяющее" H1 от H0 называют зоной индифферентности Ти. В данном примере .

Проверка гипотез о параметрах нормальных совокупностей

Пусть  − выборка, извлеченная из нормальной совокупности, хi ~ N(μ, σ2). Относительно параметров μ, σ2 возможны гипотезы Н0 следующих типов:

а) H0: μ = μ0, σ2 − известно; б) H0: μ = μ0, σ2 − неизвестно;

в)  − известно; г) − неизвестно.

Гипотезы а, в − простые; б, г − сложные. Согласно общим принципам проверки H0, необходимо выбрать статистику , распределение которой было бы известно при справедливости H0. Затем, в зависимости от выдвинутых гипотез H1, определить одностороннее или двустороннее множество Tкр заданного размера α. Ниже приведены статистики критериев для проверки гипотез а-г и указано, по каком закону они распределены при справедливости Н0:

а) ,

б) , ,

в) , ,

г) , ,

Пример 7. Исследуется коэффициент упругости образцов резины. Для этого измерили его значения у 20 образцов . По техническим условиям требуется, чтобы разброс значений коэффициента около среднего не превышал . Рассмотрим ,  − не известны (см. гипотезу г). Важно обнаружить отклонение  от  в большую сторону, поэтому . Тогда , так как большие значения S2 свидетельствуют в пользу . Удобнее, однако, вместо S2 воспользоваться пропорциональной ей статистикой , так как ее распределение при H0 известно и равно . Ее большие значения также говорят в пользу Н1, т.е. . Зафиксировав некоторый размер критерия α, найдем c1 из условия . Имеем

Отсюда , где  − квантиль распределения  уровня . Если , то . Пусть после проведения эксперимента получено

S2 = 538,2. Тогда вычисленное значение статистики . Гипотеза H0 должна быть отвергнута.

Проверка непараметрических гипотез

На практике наиболее часто встречаются с проверкой непараметрических гипотез, так как, имея экспериментальные данные, мы, как правило, не знаем закона распределения наблюдаемой случайной величины. Наиболее часто рассматривается задача о согласованности полученной выборки  с некоторым классом функций распределения. В таком случае проверка непараметрической гипотезы осуществляется с помощью критериев согласия. Рассмотрим ряд наиболее часто встречающихся критериев согласия.

Критерий согласия Пирсона (критерий хи-квадрат)

Пусть имеется выборка . Выдвигаем гипотезу H0, состоящую в том, что выборка взята из генеральной совокупности, закон распределения которой имеет функцию распределения .

Рассмотрим вначале простую гипотезу, т.е. будем считать, что параметры функция распределения  известны. Разобьем всю область значений случайной величины на k взаимно непересекающихся интервалов (hi - ,, hi), h0 = −∞, hk = +∞. Чаще всего разбиение производят на равные по длине интервалы, кроме бесконечных крайних интервалов. Зная функцию распределения  находим гипотетические вероятности попадания случайной величины в построенные интервалы

По выборочном данным подсчитываем количество членов выпавших в i-й интервал, обозначим его пi. Если гипотеза H0 справедлива, то математическое ожидание пi должно быть равно npi. Тогда статистику критерия есть смысл построить, рассматривая отклонения пi − npi. Пирсон предложил в качестве статистки критерия взять величину

Построенная таким образом статистика критерия зависит от пi, и не зависит от xi, т.е. от элементов выборки. В результате проверяется гипотеза о значениях pi. Таким образом, критерий хи-квадрат сводит задачу о проверке согласия выборки с функцией распределения  к проверке простой параметрической гипотезы о значениях вероятностей pi полиномиального распределения. Доказано, что статистика критерия  распределена по закону . Зная закон распределения статистики критерия, строим односторонюю критическую область .

Критерий согласия КолмогороваКритерий согласия Колмогорова более удобен тем, что при применении этого критерия не нужна группировка выборочных данных, которая всегда приводит к некоторой потере информации.Пусть дана выборка . По этой выборке выдвигается гипотеза H0, состоящая в той, что данная "выборка" взята из генеральной совокупности, закон распределения которой имеет функцию распределения . По данной выборке можно построить эмпирическую функцию распределения . Критерий Колмогорова основывается на сравнении этих функций распределения.Определение. Статистикой критерия Колмогорова является функция Колмогоров доказал, что асимптотическое распределение статистики  есть

← Предыдущая
Страница 1
Следующая →

Скачать

ТВ лекция 8.doc

ТВ лекция 8.doc
Размер: 442.5 Кб

Бесплатно Скачать

Пожаловаться на материал

Статистической гипотезой H называют любое утверждение относительно функции распределения F(х) некоторой случайной величины x, касающееся типа функции распределения, значения ее параметров, квантилей и т.д.

У нас самая большая информационная база в рунете, поэтому Вы всегда можете найти походите запросы

Искать ещё по теме...

Похожие материалы:

Українське питання в контексті зовнішньої політики європейських держав у 1938-1939 рр.

Актуалізація інтересу до українського питання з боку європейських держав наприкінці 1938 – на початку 1939 років. Українське питання у контексті європейської політичної кризи в березні-квітні 1939 року. Українське питання у процесі радянскько-німецького зближення і підписання пакту Молотова-Ріббентропа

Диалог двух культур: Россия-Франция первая половина XIX века.

Муниципальное управление. Цели и содержание управления на местном уровне власти

Курсовая работа. Цель настоящей работы – анализ муниципального управления в г. Фрязино, а также разработка мероприятий по содействию распространения здорового образа жизни среди населения г. Фрязино.

Санкции и санкционирование в праве. Курсовая работа

Цель курсовой работы – комплексное теоретико правовое исследование понятия сущности и специфики санкций в праве, механизмов правового регулирования. Объектом исследования являются санкции и их виды, санкционирование в праве

Кінетика - невербальний засіб спілкування

Кінетика є “мовою тіла” (будь-який рух тіла або його частин), за допомогою якої людина свідомо чи несвідомо передає зовнішньому світу своє емоційне послання.

Сохранить?

Пропустить...

Введите код

Ok