Метод моментов: различия между версиями

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску
[непроверенная версия][непроверенная версия]
Содержимое удалено Содержимое добавлено
м См. также: Project talk:Викификатор#Шаблон:Rq, replaced: {{rq|sources}} → {{подст:нет источников}}
 
(не показана 41 промежуточная версия 20 участников)
Строка 1: Строка 1:
'''Ме́тод моме́нтов''' нахождения [[Точечная оценка|оценок]] в [[Математическая статистика|математической статистике]] — это способ построения оценок, основанный на уравнивании теоретических и выборочных моментов. ([[Пирсон, Карл|Пирсон]], 1894 г.)
'''Ме́тод моме́нтов''' — метод [[Точечная оценка|оценки]] неизвестных параметров распределений в [[Математическая статистика|математической статистике]] и [[Эконометрика|эконометрике]], основанный на предполагаемых свойствах [[Моменты случайной величины|моментов]] ([[Пирсон, Карл|Пирсон]], 1894 г.). Идея метода заключается в замене истинных соотношений выборочными аналогами.


== Определение ==
== Суть метода ==
Пусть случайная величина (вектор, матрица и т. д.) ''X'' имеет некоторое [[Распределение вероятности|распределение]] <math>\mathbb{P}_{\theta}</math>, зависящее от параметров <math>\theta \in \Theta \subset \mathbb{R}^k</math>. Пусть для [[Функция (математика)|функций]] (называемых ''моментами'' или ''моментными функциями'') <math>g_i:\mathbb{R}^m \to \mathbb{R}</math>, [[Интеграл Лебега|интегрируемых]] по [[Мера множества|мере]] <math>\mathbb{P}_{\theta}</math>, выполнены ''условия на моменты''


: <math>\mathbb{E}\left[g_i(X,\theta)\right] = 0~,~~i=1..k</math>
Пусть <math>X_1,\ldots,X_n</math>  [[выборка]] из [[Распределение вероятности|распределения]] <math>\mathbb{P}_{\theta}</math>, зависящего от параметра <math>\theta \in \Theta \subset \mathbb{R}</math>. Пусть есть [[Функция (математика)|функция]] <math>g:\mathbb{R} \to \mathbb{R}</math>, такая что <math>g(X)</math> [[Интеграл Лебега|интегрируема]] относительно [[Мера множества|меры]] <math>\mathbb{P}_{\theta}</math>, и
: <math>\mathbb{E}_{\theta}\left[g(X)\right] = f(\theta)</math>,
где <math>f:\Theta \to \mathbb{R}</math> — [[биекция]]. Тогда [[Точечная оценка|оценка]]
: <math>\hat{\theta}_{\mathrm{MM}} = f^{-1}\left(\overline{g(X)}\right) \equiv f^{-1}\left(\frac{1}{n}\sum\limits_{i=1}^n g(X_i)\right)</math>
называется оценкой параметра <math>\theta \in \Theta</math> методом моментов.


Пусть <math>X_1,\ldots,X_n</math> — [[выборка]] случайной величины X. Предполагается, что соотношения, аналогичные условиям на моменты, выполнены и для выборки, а именно вместо математического ожидания в условиях на моменты необходимо использовать выборочные средние:
== Замечания ==


* По построению, <math>\overline{g(X)} = f\left(\hat{\theta}_{\mathrm{MM}}\right)</math>,
: <math>\overline {g_i(X,\theta)} = 0~,~~i=1..k</math>
то есть оценка методом моментов получается путём приравнивания [[Математическое ожидание|теоретического среднего]] <math>g(X)</math> с [[Выборочное среднее|выборочным средним]].


причем в данном представлении (когда справа от равенства — ноль) достаточно использовать просто суммы вместо средних.
* В качестве функции <math>g</math> часто берут [[Степенная функция|степенную функцию]]:
: <math>g(x) = x^k,\; k \in \mathbb{N}</math>.


Оценки, получаемые из решения этой системы уравнений (выборочных условий на моменты), называются оценками ''метода моментов''. Название метода связано с тем, что чаще всего в качестве функций <math>g_i</math> выступают функции степенного вида, математические ожидания от которых в теории вероятностей и математической статистике принято называть моментами.
* Оценка <math>\hat{\theta}_{\mathrm{MM}}</math> существенно зависит от используемой функции <math>g(x)</math>. Если возможно использование нескольких разных функций <math>g(x)</math>, полученные с их помощью оценки могут различаться.


Если моментные функции непрерывны, то оценки метода моментов [[состоятельная оценка|состоятельны]].
== Состоятельность метода ==

Если <math>f \in C(\Theta)</math>, то есть функция <math>f</math> [[Непрерывная функция|непрерывна]], то оценка метода моментов [[Состоятельная оценка|состоятельна]].

==Частные случаи==


== Частные случаи ==
Некоторые классические методы оценки регрессионных моделей можно представить как частные случаи метода моментов. Например, если линейная регрессионная модель <math>y_t=x_t^Tb+\varepsilon_t</math> удовлетворяет условию <math>E(x^T_t \varepsilon_t)=0</math>, то условия на моменты выглядят следующим образом:
Некоторые классические методы оценки регрессионных моделей можно представить как частные случаи метода моментов. Например, если линейная регрессионная модель <math>y_t=x_t^Tb+\varepsilon_t</math> удовлетворяет условию <math>E(x^T_t \varepsilon_t)=0</math>, то условия на моменты выглядят следующим образом:


<math>X^Te=0~\Rightarrow~X^T(y-Xb)=0~\Rightarrow ~X^TXb=X^Ty</math>
<math>X^Te=0~\Rightarrow~X^T(y-Xb)=0~\Rightarrow ~X^TXb=X^Ty</math>


Следовательно, в этом случае оценка метода моментов будет совпадать с [[метод наименьших квадратов|МНК-оценкой]] <math> \hat{b}_{MM}=\hat{b}_{OLS}=(X^TX)^{-1}X^Ty</math>
Следовательно, в этом случае оценка метода моментов будет совпадать с оценкой [[метод наименьших квадратов|метода наименьших квадратов]] <math> \hat{b}_{MM}=\hat{b}_{OLS}=(X^TX)^{-1}X^Ty</math>


Таким образом, МНК является частным случаем метода моментов, когда выполняется условие ортогональности регрессоров и случайных ошибок <math>E(x^T_t \varepsilon_t)=0</math>
Таким образом, МНК является частным случаем метода моментов, когда выполняется условие ортогональности регрессоров и случайных ошибок <math>E(x^T_t \varepsilon_t)=0</math>
Строка 37: Строка 29:
<math>Z^Te=0~\Rightarrow Z^T(y-Xb)=0~\Rightarrow ~Z^TXb=Z^Ty</math>
<math>Z^Te=0~\Rightarrow Z^T(y-Xb)=0~\Rightarrow ~Z^TXb=Z^Ty</math>


Следовательно оценка метода моментов будет совпадать с оценкой [[Метод инструментальных переменных|метода инструментальных переменных]]: \hat{b}_{MM}=\hat{b}_{IV}=(Z^TX)^{-1}Z^Ty</math>.
Следовательно оценка метода моментов будет совпадать с оценкой [[Метод инструментальных переменных|метода инструментальных переменных]]: <math>\hat{b}_{MM}=\hat{b}_{IV}=(Z^TX)^{-1}Z^Ty</math>.


Таким образом, [[метод инструментальных переменных]] является частным случаем метода моментов, когда выполнено условие ортогональности инструментов и случайных ошибок модели.
Таким образом, [[метод инструментальных переменных]] является частным случаем метода моментов, когда выполнено условие ортогональности инструментов и случайных ошибок модели.

== Обобщенный метод моментов ==
{{main|Обобщенный метод моментов}}
Метод моментов может быть обобщен на случай, когда количество условий на моменты превышает количество параметров, которые необходимо оценить. В этом случае очевидно однозначного решения задача не имеет (в общем случае). В таком случае решается задача на минимизацию некоторого функционала, характеризующего интегральную степень соблюдения условий на моменты.

Пусть <math>E(g(x,b))=0</math> — совокупность условий на моменты, число которых больше числа неизвестных параметров. ''Обобщенным методом моментов (ОММ, GMM — Generalized Method of Moments)'' называется оценка, минимизирующая положительно определенную квадратичную форму от выборочных условий на моменты:

<math>\hat {b}_{GMM}=\arg \min_{b} \overline {g(x,b)}^TW\overline {g(x,b)}</math>

где W — некоторая симметрическая положительно определенная матрица.

Весовая матрица теоретически может быть произвольной (с учетом ограничения положительной определенности), однако доказано, что наиболее эффективными являются GMM-оценки с весовой матрицей, равной обратной [[Ковариационная матрица|ковариационной матрице]]  моментных функций <math>W=V^{-1}_g</math>. Это так называемый ''эффективный GMM''. Однако, поскольку на практике эта ковариационная матрица неизвестна, то применяют следующую процедуру. На первом шаге оцениваются параметры модели с помощью GMM с единичной весовой матрицей. Затем по выборочным данным и найденным значениям параметров оценивают ковариационную матрицу моментных функций и используют полученную оценку в эффективном GMM (это т. н. доступный эффективный GMM).


== Пример ==
== Пример ==
Пусть <math>X_1,\ldots,X_n \sim \Gamma(\alpha,\beta)</math> — выборка из [[Гамма-распределение|гамма-распределения]] с неизвестными параметрами <math>\alpha</math> и <math>\beta</math>. Тогда

Пусть <math>X_1,\ldots,X_n \sim \Gamma(\alpha,\beta)</math> — выборка из [[Гамма распределение|гамма распределения]] с неизвестными параметрами <math>\alpha</math> и <math>\beta</math>. Тогда
: <math>\mathbb{E}[X_i] = \alpha \beta,\; \mathbb{E}\left[X_i^2\right]=\alpha(\alpha+1)\beta^2,\quad i=1,\ldots,n</math>.
: <math>\mathbb{E}[X_i] = \alpha \beta,\; \mathbb{E}\left[X_i^2\right]=\alpha(\alpha+1)\beta^2,\quad i=1,\ldots,n</math>.
Тогда оценки метода моментов удовлетворяют системе уравнений:
Тогда оценки метода моментов удовлетворяют системе уравнений:
: <math>
: <math>
\left\{
\begin{matrix}
\begin{matrix}
\bar{X} = & \hat{\alpha}_{\mathrm{MM}} \hat{\beta}_{\mathrm{MM}}\\
\overline{X} = & \hat{\alpha}_{\mathrm{MM}} \hat{\beta}_{\mathrm{MM}}\\
\overline{X^2} = & \hat{\alpha}_{\mathrm{MM}} ( \hat{\alpha}_{\mathrm{MM}} + 1 ) \left( \hat{\beta}_{\mathrm{MM}} \right)^2,
\overline{X^2} = & \hat{\alpha}_{\mathrm{MM}} ( \hat{\alpha}_{\mathrm{MM}} + 1 ) \left( \hat{\beta}_{\mathrm{MM}} \right)^2
\end{matrix}
\end{matrix}
~~
\right.
\Rightarrow~~ \hat{\alpha}_{\mathrm{MM}} = \frac{\left(\overline{X}\right)^2}{\overline{X^2} - \left(\overline{X}\right)^2}~,~~\hat{\beta}_{\mathrm{MM}} = \frac{\overline{X^2} - \left(\overline{X}\right)^2}{\overline{X}}</math>.
</math>
откуда
: <math>\hat{\alpha}_{\mathrm{MM}} = \frac{\left(\bar{X}\right)^2}{\overline{X^2} - \left(\bar{X}\right)^2}</math>,
и
: <math>\hat{\beta}_{\mathrm{MM}} = \frac{\overline{X^2} - \left(\bar{X}\right)^2}{\bar{X}}</math>.


== Преимущества и недостатки метода ==
== Преимущества и недостатки метода ==
В известной мере, при оценке параметров из известного семейства вероятностных распределений, этот метод упраздняется [[Фишер, Рональд Эйлмер|Фишеровским]] [[Метод максимального правдоподобия|методом максимального правдоподобия]], так как максимально правдоподобная оценка имеет большую вероятность оказаться ближе к истинному значению оцениваемой величины.
В известной мере, при оценке параметров из известного семейства вероятностных распределений, этот метод упраздняется [[Фишер, Рональд Эйлмер|Фишеровским]] [[Метод максимального правдоподобия|методом максимального правдоподобия]], так как максимально правдоподобная оценка имеет большую вероятность оказаться ближе к истинному значению оцениваемой величины.


Тем не менее, в некоторых случаях, например, как выше в случае Гамма-распределения, использование метода максимального правдоподобия требует использования компьютеров в то время, как метод моментов может быть быстро и легко реализован вручную.
Тем не менее, в некоторых случаях, например, как выше в случае гамма-распределения, использование метода максимального правдоподобия требует [[EM-алгоритм|использования компьютеров]], в то время как метод моментов может быть быстро и легко реализован вручную.


Оценки, полученные методом моментов, могут быть использованы как первое приближение для метода максимума правдоподобия. Дальнейшее улучшение оценок может быть получено с использованием [[Метод Ньютона|метода Ньютона-Рафсона]].
Оценки, полученные методом моментов, могут быть использованы как первое приближение для метода максимума правдоподобия. Дальнейшее улучшение оценок может быть получено с использованием [[Метод Ньютона|метода Ньютона-Рафсона]].


В некоторых случаях, редких при больших объемах данных и более частых при малом их количестве, оценки, даваемые методом моментов могут оказаться вне допустимой области. Такая проблема никогда не возникает в методе максимального правдоподобия. Также, оценки по методу моментов не обязательно оказываются [[Достаточная статистика|достаточной статистикой]], то есть, они иногда извлекают из данных не всю имеющуюся в них информацию.
В некоторых случаях, редких при больших объемах данных и более частых при малом их количестве, оценки, даваемые методом моментов могут оказаться вне допустимой области. Такая проблема никогда не возникает в методе максимального правдоподобия. Также, оценки по методу моментов не обязательно оказываются [[Достаточная статистика|достаточной статистикой]], то есть, они иногда извлекают из данных не всю имеющуюся в них информацию.

==Обобщенный метод моментов==

Метод моментов может быть обобщен на случай когда количество условий на моменты превышает количество параметров, которые необходимо оценить. В этом случае, очевидно однозначного решения задача не имеет (в общем случае). В таком случае решается задача на минимизацию некоторого функционала, характеризующего интегральную степень соблюдения условий на моменты.

Пусть <math>E(g(x,b))=0</math> - совокупность условий на моменты, число которых больше числа неизвестных параметров. Обобщенным методом моментов (ОММ, GMM - Generalized Method of Moments) называется оценка минимизирующая квадратичную форму от выборочных условий на моменты:

<math>\hat {b}_{GMM}=\arg \min_{b} \overline {g(x,b)}^TW\overline {g(x,b)}</math>

где W - некоторая симметрическая положительно определенная матрица.

Весовая матрица теоретически может быть произвольной, однако, доказано, что наиболее эффективными являются GMM-оценки с весовой матрицей, равной обратной ковариацинной матрице моментных функций <math>W=V^{-1}_g</math>. Это так называемый ''эффективный GMM''. Однако, поскольку на практике эта ковариационная матрица неизвестна, то применяют следующую процедуру. На первом шаге оцениваются параметры модели с помощью GMM с единичной весовой матрицей. Затем по выборочным данным и найденным значениям параметров оценивают коварицаонную матрицу моментных функций и используют полученную оценку в эффетивном GMM (это т.н. доступный эффективный GMM).


== См. также ==
== См. также ==
* [[Метод максимального правдоподобия]]
* [[Метод максимального правдоподобия]]
* [[Метод наименьших квадратов]]
* [[Обобщенный метод моментов]]
* [[Метод инструментальных переменных]]


{{Нет источников |дата=2024-10-20}}

[[Категория:Эконометрика]]
[[Категория:Факторный анализ]]
[[Категория:Факторный анализ]]
[[Категория:Теория оценивания]]

[[de:Momentenmethode]]
[[en:Method of moments (statistics)]]
[[fr:Méthode des moments (statistiques)]]
[[it:Metodo dei momenti (statistica)]]
[[nl:Momentschatter]]
[[uk:Метод моментів]]

Текущая версия от 07:05, 20 октября 2024

Ме́тод моме́нтов — метод оценки неизвестных параметров распределений в математической статистике и эконометрике, основанный на предполагаемых свойствах моментов (Пирсон, 1894 г.). Идея метода заключается в замене истинных соотношений выборочными аналогами.

Суть метода

[править | править код]

Пусть случайная величина (вектор, матрица и т. д.) X имеет некоторое распределение , зависящее от параметров . Пусть для функций (называемых моментами или моментными функциями) , интегрируемых по мере , выполнены условия на моменты

Пусть  — выборка случайной величины X. Предполагается, что соотношения, аналогичные условиям на моменты, выполнены и для выборки, а именно вместо математического ожидания в условиях на моменты необходимо использовать выборочные средние:

причем в данном представлении (когда справа от равенства — ноль) достаточно использовать просто суммы вместо средних.

Оценки, получаемые из решения этой системы уравнений (выборочных условий на моменты), называются оценками метода моментов. Название метода связано с тем, что чаще всего в качестве функций выступают функции степенного вида, математические ожидания от которых в теории вероятностей и математической статистике принято называть моментами.

Если моментные функции непрерывны, то оценки метода моментов состоятельны.

Частные случаи

[править | править код]

Некоторые классические методы оценки регрессионных моделей можно представить как частные случаи метода моментов. Например, если линейная регрессионная модель удовлетворяет условию , то условия на моменты выглядят следующим образом:

Следовательно, в этом случае оценка метода моментов будет совпадать с оценкой метода наименьших квадратов

Таким образом, МНК является частным случаем метода моментов, когда выполняется условие ортогональности регрессоров и случайных ошибок

Рассмотрим другой случай, когда имеются некоторые переменные z, ортогональные случайным ошибкам линейной регрессионной модели, то есть . Тогда имеем выборочный аналог этого условия:

Следовательно оценка метода моментов будет совпадать с оценкой метода инструментальных переменных: .

Таким образом, метод инструментальных переменных является частным случаем метода моментов, когда выполнено условие ортогональности инструментов и случайных ошибок модели.

Обобщенный метод моментов

[править | править код]

Метод моментов может быть обобщен на случай, когда количество условий на моменты превышает количество параметров, которые необходимо оценить. В этом случае очевидно однозначного решения задача не имеет (в общем случае). В таком случае решается задача на минимизацию некоторого функционала, характеризующего интегральную степень соблюдения условий на моменты.

Пусть  — совокупность условий на моменты, число которых больше числа неизвестных параметров. Обобщенным методом моментов (ОММ, GMM — Generalized Method of Moments) называется оценка, минимизирующая положительно определенную квадратичную форму от выборочных условий на моменты:

где W — некоторая симметрическая положительно определенная матрица.

Весовая матрица теоретически может быть произвольной (с учетом ограничения положительной определенности), однако доказано, что наиболее эффективными являются GMM-оценки с весовой матрицей, равной обратной ковариационной матрице  моментных функций . Это так называемый эффективный GMM. Однако, поскольку на практике эта ковариационная матрица неизвестна, то применяют следующую процедуру. На первом шаге оцениваются параметры модели с помощью GMM с единичной весовой матрицей. Затем по выборочным данным и найденным значениям параметров оценивают ковариационную матрицу моментных функций и используют полученную оценку в эффективном GMM (это т. н. доступный эффективный GMM).

Пусть  — выборка из гамма-распределения с неизвестными параметрами и . Тогда

.

Тогда оценки метода моментов удовлетворяют системе уравнений:

.

Преимущества и недостатки метода

[править | править код]

В известной мере, при оценке параметров из известного семейства вероятностных распределений, этот метод упраздняется Фишеровским методом максимального правдоподобия, так как максимально правдоподобная оценка имеет большую вероятность оказаться ближе к истинному значению оцениваемой величины.

Тем не менее, в некоторых случаях, например, как выше в случае гамма-распределения, использование метода максимального правдоподобия требует использования компьютеров, в то время как метод моментов может быть быстро и легко реализован вручную.

Оценки, полученные методом моментов, могут быть использованы как первое приближение для метода максимума правдоподобия. Дальнейшее улучшение оценок может быть получено с использованием метода Ньютона-Рафсона.

В некоторых случаях, редких при больших объемах данных и более частых при малом их количестве, оценки, даваемые методом моментов могут оказаться вне допустимой области. Такая проблема никогда не возникает в методе максимального правдоподобия. Также, оценки по методу моментов не обязательно оказываются достаточной статистикой, то есть, они иногда извлекают из данных не всю имеющуюся в них информацию.