F-тест: различия между версиями

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску
[отпатрулированная версия][непроверенная версия]
Содержимое удалено Содержимое добавлено
м орфография, пунктуация, typos fixed: объемом → объёмом (3) с помощью AWB
Метки: с мобильного устройства из мобильной версии через расширенный мобильный режим
 
(не показана 21 промежуточная версия 16 участников)
Строка 1: Строка 1:
{{не путать|Точный тест Фишера|точным тестом Фишера|тестом статистической значимости, используемым в анализе таблиц сопряжённости}}
'''F-тестом''' или '''критерием Фишера''' (F-критерием, φ*-критерием) — называют любой [[статистический критерий]], тестовая статистика которого при выполнении [[Нулевая гипотеза|нулевой гипотезы]] имеет [[распределение Фишера]] (F-распределение).

'''F-тест''' или '''критерий Фишера''' (F-критерий, φ*-критерий) — [[статистический критерий]], тестовая статистика которого при выполнении [[Нулевая гипотеза|нулевой гипотезы]] имеет [[распределение Фишера]] (F-распределение).


Статистика теста так или иначе сводится к отношению выборочных дисперсий (сумм квадратов, деленных на «степени свободы»). Чтобы статистика имела распределение Фишера, необходимо, чтобы числитель и знаменатель были независимыми случайными величинами и соответствующие суммы квадратов имели распределение [[Хи-квадрат]]. Для этого требуется, чтобы данные имели нормальное распределение. Кроме того, предполагается, что дисперсия случайных величин, квадраты которых суммируются, одинакова.
Статистика теста так или иначе сводится к отношению выборочных дисперсий (сумм квадратов, деленных на «степени свободы»). Чтобы статистика имела распределение Фишера, необходимо, чтобы числитель и знаменатель были независимыми случайными величинами и соответствующие суммы квадратов имели распределение [[Хи-квадрат]]. Для этого требуется, чтобы данные имели нормальное распределение. Кроме того, предполагается, что дисперсия случайных величин, квадраты которых суммируются, одинакова.


Тест проводится путём сравнения значения статистики с критическим значением соответствующего распределения Фишера при заданном уровне значимости. Известно, что если <math>F \sim F(m,n)</math>, то <math>1/F \sim F(n,m)</math>. Кроме того, квантили распределения Фишера обладают свойством <math>F_{1-\alpha}=1/F_{\alpha}</math>. Поэтому обычно на практике в числителе участвует потенциально большая величина, в знаменателе — меньшая и сравнение осуществляется с «правой» квантилью распределения. Тем не менее тест может быть и двусторонним и односторонним. В первом случае при уровне значимости <math>\alpha</math> используется квантиль <math>F_{\alpha/2}</math>, а при одностороннем тесте <math>F_{\alpha}</math><ref>[http://www.vsetabl.ru/183.htm Таблица 15х20 критических значений критерия Фишера (F-критерия) для уровня значимости 0.05]</ref>.
Тест проводится путём сравнения значения статистики с критическим значением соответствующего распределения Фишера при заданном уровне значимости. Известно, что если <math>F \sim F(m,n)</math>, то <math>1/F \sim F(n,m)</math>. Кроме того, квантили распределения Фишера обладают свойством <math>F_{1-\alpha}=1/F_{\alpha}</math>. Поэтому обычно на практике в числителе участвует потенциально большая величина, в знаменателе — меньшая и сравнение осуществляется с «правой» квантилью распределения. Тем не менее тест может быть и двусторонним, и односторонним. В первом случае при уровне значимости <math>\alpha</math> используется квантиль <math>F_{\alpha/2}</math>, а при одностороннем тесте <math>F_{\alpha}</math><ref>{{cw|url=http://www.itl.nist.gov/div898/handbook/eda/section3/eda359.htm|title=F-Test for Equality of Two Variances|publisher=[[NIST]]|lang=en|accessdate=2017-03-29|archive-date=2017-03-09|archive-url=https://web.archive.org/web/20170309092823/http://itl.nist.gov/div898/handbook/eda/section3/eda359.htm|deadlink=no}}</ref>.


Более удобный способ проверки гипотез — с помощью [[p-значение|p-значения]] <math>p(F)</math> — вероятностью того, что случайная величина с данным распределением Фишера превысит данное значение статистики. Если <math>p(F)</math> (для двустороннего теста — <math>2p(F</math>)) меньше уровня значимости <math>\alpha</math>, то нулевая гипотеза отвергается, в противном случае принимается.
Более удобный способ проверки гипотез — с помощью [[p-значение|p-значения]] <math>p(F)</math> — вероятностью того, что случайная величина с данным распределением Фишера превысит данное значение статистики. Если <math>p(F)</math> (для двустороннего теста — <math>2p(F</math>)) меньше уровня значимости <math>\alpha</math>, то нулевая гипотеза отвергается, в противном случае принимается.
Строка 10: Строка 12:


=== F-тест на равенство дисперсий ===
=== F-тест на равенство дисперсий ===

==== Две выборки ====
==== Две выборки ====
Пусть имеются две выборки объёмом m и n соответственно случайных величин X и Y, имеющих нормальное распределение. Необходимо проверить равенство их дисперсий. Статистика теста
Пусть имеются две выборки объёмом m и n соответственно случайных величин X и Y, имеющих нормальное распределение. Необходимо проверить равенство их дисперсий. Статистика теста
Строка 17: Строка 20:
где <math>{\hat{\sigma}^2}</math> — [[выборочная дисперсия]].
где <math>{\hat{\sigma}^2}</math> — [[выборочная дисперсия]].


Если статистика больше критического, то дисперсии не одинаковы, в противном случае дисперсии выборок одинаковы
Если статистика больше критического значения, соответствующего выбранному уровню [[Статистическая значимость|значимости]], то дисперсии случайных величин признаются не одинаковыми.


==== Несколько выборок ====
==== Несколько выборок ====
Строка 29: Строка 32:
<math>F=\frac {\hat{\sigma}^2_{BG}}{\hat{\sigma}^2_{WG}}~\sim~F(k-1,N-k)</math>
<math>F=\frac {\hat{\sigma}^2_{BG}}{\hat{\sigma}^2_{WG}}~\sim~F(k-1,N-k)</math>


Данный тест можно свести к тестированию значимости регрессии переменной X на [[фиктивная переменная|фиктивные переменные]]-индикаторы групп. Если статистика превышает критическое значение, то гипотеза о равенстве дисперсий в выборках отвергается, в противном случае дисперсии можно считать одинаковыми.
Данный тест можно свести к тестированию значимости регрессии переменной X на [[фиктивная переменная|фиктивные переменные]]-индикаторы групп. Если статистика превышает критическое значение, то гипотеза о равенстве средних в выборках отвергается, в противном случае средние можно считать одинаковыми.


=== Проверка ограничений на параметры регрессии ===
=== Проверка ограничений на параметры регрессии ===
Строка 35: Строка 38:
Статистика теста для проверки линейных ограничений на параметры классической нормальной линейной регрессии определяется по формуле:
Статистика теста для проверки линейных ограничений на параметры классической нормальной линейной регрессии определяется по формуле:


<math>F=\frac {(ESS_S-ESS_L)/q}{ESS_L/(n-k_L)}=\frac {(R^2_L-R^2_S)/q}{(1-R^2_L)/(n-k_L)}~\sim ~F(q,n-k_L)</math>
<math>F=\frac {(RSS_S-RSS_L)/q}{RSS_L/(n-k_L)}=\frac {(R^2_L-R^2_S)/q}{(1-R^2_L)/(n-k_L)}~\sim ~F(q,n-k_L)</math>


где <math>q=k_L-k_S</math> -количество ограничений, n-объём выборки, k-количество параметров модели, ESS-сумма квадратов остатков модели, <math>R^2</math>-коэффициент детерминации, индексы S и L относятся соответственно к короткой и длинной модели (модели с ограничениями и модели без ограничений).
где <math>q=k_L-k_S</math> -количество ограничений, n-объём выборки, k-количество параметров модели, RSS-сумма квадратов остатков модели, <math>R^2</math>-коэффициент детерминации, индексы S и L относятся соответственно к короткой и длинной модели (модели с ограничениями и модели без ограничений).


==== Замечание ====
==== Замечание ====
Строка 44: Строка 47:


<math>F=\frac {n-k}{q} W/n ~,~ F=\frac {n-k}{q} \frac {LM} {n-LM} ~,~F=\frac {n-k}{q}(e^{LR/n}-1)</math>
<math>F=\frac {n-k}{q} W/n ~,~ F=\frac {n-k}{q} \frac {LM} {n-LM} ~,~F=\frac {n-k}{q}(e^{LR/n}-1)</math>
Все эти статистики асимптотически имеют распределение F(q, n-k), несмотря на то, что их значения на малых выборках могут различаться.
Все эти статистики асимптотически имеют распределение F(q, n-k), несмотря на то, что их значения на малых выборках могут различаться.


=== Проверка значимости линейной регрессии ===
=== Проверка значимости линейной регрессии ===
Строка 55: Строка 58:
==== Пример ====
==== Пример ====


Пусть оценивается линейная регрессия доли расходов на питание в общей сумме расходов на константу, логарифм совокупных расходов, количество взрослых членов семьи и количество детей до 11 лет. То есть всего в модели 4 оцениваемых параметра (k=4). Пусть по результатам оценки регрессии получен коэффициент детерминации <math>R^2=41.2366%</math>. По вышеприведенной формуле рассчитаем значение F-статистики в случае, если регрессия оценена по данным 34 наблюдений и по данным 64 наблюдений:
Пусть оценивается линейная регрессия доли расходов на питание в общей сумме расходов на константу, логарифм совокупных расходов, количество взрослых членов семьи и количество детей до 11 лет. То есть всего в модели 4 оцениваемых параметра (k=4). Пусть по результатам оценки регрессии получен коэффициент детерминации <math>R^2=41.2366\%</math>. По вышеприведенной формуле рассчитаем значение F-статистики в случае, если регрессия оценена по данным 34 наблюдений и по данным 64 наблюдений:
<math>F_1=\frac {0.412366/(4-1)}{(1-0.412366)/(34-4)}=0,70174*10=7,02</math>
<math>F_1=\frac {0.412366/(4-1)}{(1-0.412366)/(34-4)}=0,70174*10=7,02</math>


<math>F_2=\frac {0.412366/(4-1)}{(1-0.412366)/(64-4)}=0,70174*20=14.04</math>
<math>F_2=\frac {0.412366/(4-1)}{(1-0.412366)/(64-4)}=0,70174*20=14.04</math>


Критическое значение статистики при 1 % уровне значимости (в Excel функция FРАСПОБР) в первом случае равно <math>F_{1%}(3,30)=4,51</math>, а во втором случае <math>F_{1%}(3,60)=4,13</math>. В обоих случаях регрессия признается значимой при заданном уровне значимости. В первом случае P-значение равно 0,1 %, а во втором — 0,00005 %. Таким образом, во втором случае уверенность в значимости регрессии существенно выше (существенно меньше вероятность ошибки в случае признания модели значимой).
Критическое значение статистики при 1 % уровне значимости (в Excel функция FРАСПОБР) в первом случае равно <math>F_{1\%}(3,30)=4,51</math>, а во втором случае <math>F_{1\%}(3,60)=4,13</math>. В обоих случаях регрессия признается значимой при заданном уровне значимости. В первом случае P-значение равно 0,1 %, а во втором — 0,00005 %. Таким образом, во втором случае уверенность в значимости регрессии существенно выше (существенно меньше вероятность ошибки в случае признания модели значимой).


=== Проверка гетероскедастичности ===
=== Проверка гетероскедастичности ===
Строка 72: Строка 75:
* [[Тест множителей Лагранжа]]
* [[Тест множителей Лагранжа]]
* [[Тест Голдфелда-Куандта]]
* [[Тест Голдфелда-Куандта]]
* [[t-критерий Стьюдента]]


== Примечания ==
== Примечания ==
{{Примечания}}
{{Примечания}}

== Ссылки ==
* [http://www.public.iastate.edu/~alicia/stat328/Multiple%20regression%20-%20F%20test.pdf Testing utility of model — F-test]
* [http://rkb.home.cern.ch/rkb/AN16pp/node81.html F-test]
* [http://www.psychol-ok.ru/statistics/fisher/ Автоматический расчет φ* критерия]
* [http://www.vsetabl.ru/183.htm Таблица 15х20 критических значений критерия Фишера (F-критерия) для уровня значимости 0.05]

{{статистика}}


[[Категория:Статистические критерии]]
[[Категория:Статистические критерии]]
[[Категория:Эконометрика]]
[[Категория:Дисперсионный анализ]]
[[Категория:Дисперсионный анализ]]

Текущая версия от 17:47, 30 ноября 2023

F-тест или критерий Фишера (F-критерий, φ*-критерий) — статистический критерий, тестовая статистика которого при выполнении нулевой гипотезы имеет распределение Фишера (F-распределение).

Статистика теста так или иначе сводится к отношению выборочных дисперсий (сумм квадратов, деленных на «степени свободы»). Чтобы статистика имела распределение Фишера, необходимо, чтобы числитель и знаменатель были независимыми случайными величинами и соответствующие суммы квадратов имели распределение Хи-квадрат. Для этого требуется, чтобы данные имели нормальное распределение. Кроме того, предполагается, что дисперсия случайных величин, квадраты которых суммируются, одинакова.

Тест проводится путём сравнения значения статистики с критическим значением соответствующего распределения Фишера при заданном уровне значимости. Известно, что если , то . Кроме того, квантили распределения Фишера обладают свойством . Поэтому обычно на практике в числителе участвует потенциально большая величина, в знаменателе — меньшая и сравнение осуществляется с «правой» квантилью распределения. Тем не менее тест может быть и двусторонним, и односторонним. В первом случае при уровне значимости используется квантиль , а при одностороннем тесте — [1].

Более удобный способ проверки гипотез — с помощью p-значения  — вероятностью того, что случайная величина с данным распределением Фишера превысит данное значение статистики. Если (для двустороннего теста — )) меньше уровня значимости , то нулевая гипотеза отвергается, в противном случае принимается.

Примеры F-тестов

[править | править код]

F-тест на равенство дисперсий

[править | править код]

Две выборки

[править | править код]

Пусть имеются две выборки объёмом m и n соответственно случайных величин X и Y, имеющих нормальное распределение. Необходимо проверить равенство их дисперсий. Статистика теста

где  — выборочная дисперсия.

Если статистика больше критического значения, соответствующего выбранному уровню значимости, то дисперсии случайных величин признаются не одинаковыми.

Несколько выборок

[править | править код]

Пусть выборка объёмом N случайной величины X разделена на k групп с количеством наблюдений в i-ой группе.

Межгрупповая («объяснённая») дисперсия:

Внутригрупповая («необъяснённая») дисперсия:

Данный тест можно свести к тестированию значимости регрессии переменной X на фиктивные переменные-индикаторы групп. Если статистика превышает критическое значение, то гипотеза о равенстве средних в выборках отвергается, в противном случае средние можно считать одинаковыми.

Проверка ограничений на параметры регрессии

[править | править код]

Статистика теста для проверки линейных ограничений на параметры классической нормальной линейной регрессии определяется по формуле:

где -количество ограничений, n-объём выборки, k-количество параметров модели, RSS-сумма квадратов остатков модели, -коэффициент детерминации, индексы S и L относятся соответственно к короткой и длинной модели (модели с ограничениями и модели без ограничений).

Описанный выше F-тест является точным в случае нормального распределения случайных ошибок модели. Однако F-тест можно применить и в более общем случае. В этом случае он является асимптотическим. Соответствующую F-статистику можно рассчитать на основе статистик других асимптотических тестов — теста Вальда (W), теста множителей Лагранжа(LM) и теста отношения правдоподобия (LR) — следующим образом:

Все эти статистики асимптотически имеют распределение F(q, n-k), несмотря на то, что их значения на малых выборках могут различаться.

Проверка значимости линейной регрессии

[править | править код]

Данный тест очень важен в регрессионном анализе и по существу является частным случаем проверки ограничений. В данном случае нулевая гипотеза — об одновременном равенстве нулю всех коэффициентов при факторах регрессионной модели (то есть всего ограничений k-1). В данном случае короткая модель — это просто константа в качестве фактора, то есть коэффициент детерминации короткой модели равен нулю. Статистика теста равна:

Соответственно, если значение этой статистики больше критического значения при данном уровне значимости, то нулевая гипотеза отвергается, что означает статистическую значимость регрессии. В противном случае модель признается незначимой.

Пусть оценивается линейная регрессия доли расходов на питание в общей сумме расходов на константу, логарифм совокупных расходов, количество взрослых членов семьи и количество детей до 11 лет. То есть всего в модели 4 оцениваемых параметра (k=4). Пусть по результатам оценки регрессии получен коэффициент детерминации . По вышеприведенной формуле рассчитаем значение F-статистики в случае, если регрессия оценена по данным 34 наблюдений и по данным 64 наблюдений:

Критическое значение статистики при 1 % уровне значимости (в Excel функция FРАСПОБР) в первом случае равно , а во втором случае . В обоих случаях регрессия признается значимой при заданном уровне значимости. В первом случае P-значение равно 0,1 %, а во втором — 0,00005 %. Таким образом, во втором случае уверенность в значимости регрессии существенно выше (существенно меньше вероятность ошибки в случае признания модели значимой).

Проверка гетероскедастичности

[править | править код]

См. Тест Голдфелда-Куандта

Примечания

[править | править код]
  1. F-Test for Equality of Two Variances (англ.). NIST. Дата обращения: 29 марта 2017. Архивировано 9 марта 2017 года.