Полуинвариант (теория вероятностей): различия между версиями

Интерактивная навигация по истории

(Показать все непатрулированные изменения)

[отпатрулированная версия]

[непроверенная версия]

← Предыдущая правка

Содержимое удалено Содержимое добавлено

ВизуальныйВики-текст

Линейный

Текущая версия от 23:19, 24 декабря 2024

Полуинварианты, или семиинварианты, или кумулянты — коэффициенты в разложении логарифма характеристической функции случайной величины в ряд Маклорена^[1].

Определение

Через характеристическую функцию

Полуинварианты, в отличие от моментов, не могут быть определены напрямую через функцию распределения $p(x)$ . Их определяют либо через логарифм характеристической функции $G(u)$ , либо через моменты $\mu$ (второе определение вытекает из первого). Формально, полуинварианты определяются как коэффициенты в разложении в ряд Маклорена логарифма характеристической функции аналогично тому, как определяются моменты для самой характеристической функции:

\ln G(u)\,=\,iu\kappa _{1}+{\frac {(iu)^{2}}{2!}}\kappa _{2}+\ldots +{\frac {(iu)^{n}}{n!}}\kappa _{n}+\ldots =\sum \limits _{n=1}^{\infty }{\frac {(iu)^{n}}{n!}}\kappa _{n}

.

Единственное отличие состоит в том, что первый член этого ряда принимается равным $0$ , а не $1$ как в случае моментов. Поэтому логарифм характеристической функции является производящей функцией для полуинвариантов, его иногда называют второй характеристической функцией и обозначают:

\varphi (u)\,\equiv \,\ln G(u)

.

Интерес к этой функции обусловлен тем, что она аддитивна для независимых случайных величин, то есть для суммы таких величин она равна сумме соответствующих функций для каждой величины:

\ln G(a+b)=\ln G(a)+\ln G(b)

.

Это очевидно следует из того факта, что характеристическая мультипликативная функция по независимым случайным величинам равна произведению соответствующих функций. Это же свойство, как следствие, присуще полуинвариантам: в частности, поскольку первым и вторым полуинвариантом случайной величины служат её математическое ожидание и дисперсия, то для суммы независимых случайных величин они соответственно равны сумме математических ожиданий или дисперсий самих величин (это верно и для третьего центрального момента, который поэтому совпадает с третьим полуинвариантом. Для четвёртых и более высоких центрированных моментов это равенство уже не выполняется). Указанное свойство упрощает работу с кумулянтами, так как для них, в отличие от моментов распределения суммы независимых случайных величин, имеющих достаточно громоздкое выражение через моменты самих величин, выражение через полуинварианты слагаемых весьма просто.

Из определения ряда Маклорена полуинвариант порядка $n$ определяется как:

\kappa _{n}\,=\,(-i)^{n}\left.{\frac {\,\partial ^{n}\varphi }{\,\partial u^{n}}}\right|_{u=0}

.

В частности, для первого полуинварианта имеем:

\kappa _{1}\,=\,-i\left.{\frac {\,\partial \varphi }{\,\partial u}}\right|_{u=0}\,=\,-i\left.{\frac {G'_{u}}{\,G(u)}}\right|_{u=0}

.

Через моменты

Выведем теперь альтернативное определение полуинварианта через моменты. Разлагая характеристическую функцию $G(u)$ в ряд Маклорена через моменты, можно переписать первую формулу в следующем виде:

\ln \left\{1+\sum \limits _{n=1}^{\infty }{\frac {(iu)^{n}}{n!}}\mu _{n}\right\}\,=\,\sum \limits _{n=1}^{\infty }{\frac {(iu)^{n}}{n!}}\kappa _{n}

.

Разлагая и логарифм в ряд Маклорена и предполагая, что условия на его радиус сходимости выполняются, мы получим:

\sum \limits _{m=1}^{\infty }(-1)^{m+1}{\frac {\displaystyle \left(\sum \limits _{n=1}^{\infty }{\frac {(iu)^{n}}{n!}}\mu _{n}\right)^{\!\!m}}{m}}\,=\,\sum \limits _{n=1}^{\infty }{\frac {(iu)^{n}}{n!}}\kappa _{n}

.

Приравнивая коэффициенты при равных степенях $iu$ в суммах слева и справа, получаем:

{\begin{cases}\kappa _{1}=\mu _{1}\\[1mm]\kappa _{2}=-\mu _{1}^{2}+\mu _{2}\\[1mm]\kappa _{3}=2\mu _{1}^{3}-3\mu _{1}\mu _{2}+\mu _{3}\\[1mm]\;\ldots \end{cases}}

.

Интересный метод, основанный на производной для более простого отыскания этих взаимоотношений, а также эти выражения для более высоких порядков описаны у Кендалла. Он также даёт общую формулу для поиска моментов через полуинварианты и обратно, эта же формула встречается и у Ширяева. Кстати, эту общую формулу в некоторой литературе так и называют формулой Ширяева-Леонтьева, хотя по всей видимости они не были первыми, кто её вывел.

История

Полуинварианты были введены датским астрономом и математиком Торвальдом Николаем Тиле в 1889 году (по другим данным в 1903 году). В русском языке также используется название семиинварианты (от латинского semi-, что означает полу-, половина). Тиле назвал эти статистические величины полуинвариантами (semi-invariant), и до 1930-х годов их так и называли, пока английский статистик Фишер не предложил название кумулянты (англ. cumulants), ввиду их кумулятивных свойств, и со временем именно это название и закрепилось в литературе. Тем не менее, в русскоязычной литературе предпочтение всегда отдавалось оригинальному названию, например Ширяев использует только лишь оригинальное латинское название. Для обозначения полуинвариант почти всегда используется греческая буква $\kappa$ , хотя, например, Ширяев использует $\zeta$ .

Несмотря на то, что введены полуинварианты были давно, им уделяли очень мало внимания: только лишь в конце 1930-х годов Фишер впервые провёл систематическое исследование полуинвариантов.

На сегодняшний день полуинварианты прочно вошли в мир современной статистики и её приложений. В частности они очень широко используются в области обработки сигналов, что связано с некоторыми их полезными свойствами: например, все полуинварианты третьего и более высоких порядков равны нулю для нормальных процессов, а смешанные полуинварианты всех порядков статистически независимых величин равны нулю. Используя понятие полуинвариантов, можно ввести более общее понятие статистической независимости двух величин до $n$ -го порядка, подразумевая под этим то, что все смешанные полуинварианты порядка до $n$ (включительно) равны нулю.

Примечания

↑ Прохоров Ю. В., Розанов Ю. А. Теория вероятностей (Основные понятия. Предельные теоремы. Случайные процессы) — М.: Главная редакция физико-математической литературы изд-ва «Наука», 1973. - 496 стр.

[ПрохоровРозанов-1] Прохоров Ю. В., Розанов Ю. А. Теория вероятностей (Основные понятия. Предельные теоремы. Случайные процессы) — М.: Главная редакция физико-математической литературы изд-ва «Наука», 1973. - 496 стр.

[1]

@@ Строка 1: / Строка 1: @@
-'''Полуинварианты''', или '''семиинварианты''', или '''кумулянты''' — это коэффициенты в разложении логарифма [[Характеристическая функция случайной величины|характеристической функции случайной величины]] в [[Ряд Тейлора|ряд МакЛорена]].
+'''Полуинварианты''', или '''семиинварианты''', или '''кумулянты''' — [[Коэффициент|коэффициенты]] в разложении [[Логарифм|логарифма]] [[Характеристическая функция случайной величины|характеристической функции случайной величины]] в [[Ряд Тейлора|ряд Маклорена]]<ref name = ПрохоровРозанов>Прохоров Ю. В., Розанов Ю. А. Теория вероятностей (Основные понятия. Предельные теоремы. Случайные процессы) — М.:  Главная редакция физико-математической литературы изд-ва «Наука», 1973. - 496 стр. </ref>.
 == Определение ==
 === Через характеристическую функцию ===
 {{стиль}}
-Полуинварианты, в отличие от моментов, не могут быть определены напрямую через функцию распределения ''p''(''x''). Их определяют либо через логарифм характеристической функции ''G''(''u''), либо через моменты μ (второе определение, на самом деле, вытекает из первого). Формально, полуинварианты определяются как коэффициенты в разложении в ряд МакЛорена логарифма характеристической функции аналогично тому, как опреляются моменты для самой [[Характеристическая функция случайной величины|характеристической функции]]:
+Полуинварианты, в отличие от [[Моменты случайной величины|моментов]], не могут быть определены напрямую через [[Функция распределения|функцию распределения]] <math>p(x)</math>. Их определяют либо через логарифм характеристической функции <math>G(u)</math>, либо через моменты <math>\mu</math> (второе определение вытекает из первого). Формально, полуинварианты определяются как коэффициенты в разложении в ряд Маклорена логарифма характеристической функции аналогично тому, как определяются моменты для самой характеристической функции:
-:<math>\ln G(u) \, = \, iu\kappa_1 + \frac{(iu)^2}{2!}\kappa_2 + \ldots +\frac{(iu)^n}{n!} \kappa_n + \ldots = \sum\limits_{n=1}^{\infty}\frac{(iu)^n}{n!} \kappa_n</math>
+: <math>\ln G(u) \, = \, iu\kappa_1 + \frac{(iu)^2}{2!}\kappa_2 + \ldots +\frac{(iu)^n}{n!} \kappa_n + \ldots = \sum\limits_{n=1}^{\infty}\frac{(iu)^n}{n!} \kappa_n</math>.
-Единственное отличие состоит в том, что первый член этого ряда полагается равным 0, а не 1 как в случае моментов. Таким образом, логарифм характеристической функции является производящей функцией для полуинвариантов, его иногда называют ''второй характеристической функцей'' и обозначают:
+Единственное отличие состоит в том, что первый член этого ряда принимается равным <math>0
+</math>, а не <math>1
+</math> как в случае моментов. Поэтому логарифм характеристической функции является производящей функцией для полуинвариантов, его иногда называют ''второй характеристической функцией'' и обозначают:
-:<math>\varphi(u)\,\equiv\,\ln G(u).</math>
+: <math>\varphi(u)\,\equiv\,\ln G(u)</math>.
-Интерес к этой функции обусловлен тем, что она аддитивна для независимых случайных величин, т.е. для суммы таких величин она равна сумме соответстующих функций для каждой величины:
+Интерес к этой функции обусловлен тем, что она [[Аддитивность (математика)|аддитивна]] для независимых случайных величин, то есть для суммы таких величин она равна сумме соответствующих функций для каждой величины:
-:<math>\ln G(a+b)  = \ln G(a)+\ln G(b).</math>
+: <math>\ln G(a+b)  = \ln G(a)+\ln G(b)</math>.
-Это с очевидностью следует из того факта, что характеристическая функция мультипликативна по независимым случайным величинам (равна произведению соответствующих функций). Это же свойство, как следствие, присуще полуинвариантам: в частности, поскольку первым и вторым полуинвариантом случайной величины служат ее [[математическое ожидание]] и [[дисперсия]], то для суммы независимых случайных величин они соответственно равны сумме математических ожиданий или дисперсий самих величин. (Это верно и для [[Моменты случайной величины|третьего центральнного момента]], который поэтому совпадает с третьим полуинвариантом. Для четвертых и более высоких центрированных моментов это равенство уже не выполняется.) Указанное свойство упрощает работу с кумулянтами, так как для них, в отличие от моментов распределения суммы независимых случайных величин, имеющих достаточно громоздкое выражение через моменты самих величин, выражение через полуинвариатны слагаемых весьма просто.
+Это очевидно следует из того факта, что характеристическая  [[мультипликативная функция]] по независимым случайным величинам равна произведению соответствующих функций. Это же свойство, как следствие, присуще полуинвариантам: в частности, поскольку первым и вторым полуинвариантом случайной величины служат её [[математическое ожидание]] и [[Дисперсия случайной величины|дисперсия]], то для суммы независимых случайных величин они соответственно равны сумме математических ожиданий или дисперсий самих величин (это верно и для [[Моменты случайной величины|третьего центрального момента]], который поэтому совпадает с третьим полуинвариантом. Для четвёртых и более высоких центрированных моментов это равенство уже не выполняется). Указанное свойство упрощает работу с кумулянтами, так как для них, в отличие от моментов распределения суммы независимых случайных величин, имеющих достаточно громоздкое выражение через моменты самих величин, выражение через полуинварианты слагаемых весьма просто.
-Из определения ряда МакЛорена полуинвариант порядка ''n'' определяется как:
+Из определения ряда Маклорена полуинвариант порядка <math>n</math> определяется как:
-:<math>\kappa_n \,=\, (-i)^n \left.\frac{\,\partial^n\varphi}{\,\partial u^n}\right|_{u=0}.</math>
+: <math>\kappa_n \,=\, (-i)^n \left.\frac{\,\partial^n\varphi}{\,\partial u^n}\right|_{u=0}</math>.
 В частности, для первого полуинварианта имеем:
-:<math>\kappa_1 \,=\, -i \left.\frac{\,\partial\varphi}{\,\partial u}\right|_{u=0}\,=\,-i \left.\frac{G'_u}{\,G(u)}\right|_{u=0}.</math>
+: <math>\kappa_1 \,=\, -i \left.\frac{\,\partial\varphi}{\,\partial u}\right|_{u=0}\,=\,-i \left.\frac{G'_u}{\,G(u)}\right|_{u=0}</math>.
 === Через моменты ===
-Выведем теперь альтернативное определение полуинварианта через моменты. Разлагая характеристическую функцию ''G''(''u'') в ряд МакЛорена через моменты, можно переписать первую формулу в следующем виде:
+Выведем теперь альтернативное определение полуинварианта через моменты. Разлагая характеристическую функцию <math>G(u)</math> в ряд Маклорена через моменты, можно переписать первую формулу в следующем виде:
-:<math>\ln \left\{1+\sum\limits_{n=1}^{\infty}\frac{(iu)^n}{n!} \mu_n \right\} \,  = \,\sum\limits_{n=1}^{\infty}\frac{(iu)^n}{n!} \kappa_n</math>
+: <math>\ln \left\{1+\sum\limits_{n=1}^{\infty}\frac{(iu)^n}{n!} \mu_n \right\} \,  = \,\sum\limits_{n=1}^{\infty}\frac{(iu)^n}{n!} \kappa_n</math>.
-Разлагая и логарифм в ряд МакЛорена и предполагая, что условия на его радиус сходимости выполняются, мы получим:
+Разлагая и логарифм в ряд Маклорена и предполагая, что условия на его [[радиус сходимости]] выполняются, мы получим:
-:<math>\sum\limits_{m=1}^{\infty}(-1)^{m+1}\frac{\displaystyle\left(\sum\limits_{n=1}^{\infty}\frac{(iu)^n}{n!} \mu_n \right)^{\!\!m} }{m} \,=\,\sum\limits_{n=1}^{\infty}\frac{(iu)^n}{n!} \kappa_n</math>
+: <math>\sum\limits_{m=1}^{\infty}(-1)^{m+1}\frac{\displaystyle\left(\sum\limits_{n=1}^{\infty}\frac{(iu)^n}{n!} \mu_n \right)^{\!\!m} }{m} \,=\,\sum\limits_{n=1}^{\infty}\frac{(iu)^n}{n!} \kappa_n</math>.
-Приравнивая коэффициенты при равных степенях ''iu'' в суммах слева и справа, получаем:
+Приравнивая коэффициенты при равных степенях <math>iu</math> в суммах слева и справа, получаем:
-:<math>\begin{cases}
+: <math>\begin{cases}
 \kappa_1=\mu_1 \\[1mm]
 \kappa_2=-\mu^2_1+\mu_2 \\[1mm]
 \kappa_3=2\mu^3_1-3\mu_1\mu_2 +\mu_3 \\[1mm]
 \;\ldots
-\end{cases}</math>
+\end{cases}</math>.
-Интересный метод основанный на производной для более простого отыскания этих взаимоотношений, а также эти выражения для более высоких порядков описаны у Кендалла. Он также даёт общую формулу для отысканий моментов через полуинварианты и обратно, эта же формула встречается и у [[Ширяев, Альберт Николаевич|Ширяева]]. Кстати, эту общую формулу в некоторой литературе так и называют формулой Ширяева—Леонтьева, хотя по всей видимости они не были первыми, кто её вывели.
+Интересный метод, основанный на производной для более простого отыскания этих взаимоотношений, а также эти выражения для более высоких порядков описаны у Кендалла. Он также даёт общую формулу для поиска [[Моменты случайной величины|моментов]] через полуинварианты и обратно, эта же формула встречается и у [[Ширяев, Альберт Николаевич|Ширяева]]. Кстати, эту общую формулу в некоторой литературе так и называют формулой Ширяева-Леонтьева, хотя по всей видимости они не были первыми, кто её вывел.
 == История ==
-'''Полуинварианты''' были введены датским астрономом и математиком [[Торвальд Николай Тиле|Торвальдом Николаем Тиле]] в 1889 году (по другим данным в 1903 году). В русском языке также используется название '''семиинварианты''' (от латинского semi-, что означает полу-, половина). Тиле назвал эти статистические величины полуинвариантами (semi-invariant), и до 1930-х годов их так и называли, пока английский статистик [[Фишер, Рональд Эйлмер|Фишер]] не предложил название '''кумулянты''' ({{lang-en|cumulants}}), ввиду их кумулятивных свойств, и со временем именно это название и закрепилось в литературе. Тем не менее, в русскоязычной литературе предпочтение всегда отдавалось оригинальному названию, например, [[Ширяев, Альберт Николаевич|Ширяев]] использует только лишь оригинальное латинское название. Для обозначения полуинвариант почти всегда используется греческая буква κ, хотя, например, Ширяев использует ξ.
+'''Полуинварианты''' были введены датским астрономом и математиком [[Торвальд Николай Тиле|Торвальдом Николаем Тиле]] в 1889 году (по другим данным в 1903 году). В русском языке также используется название '''семиинварианты''' (от латинского semi-, что означает полу-, половина). Тиле назвал эти статистические величины полуинвариантами (semi-invariant), и до 1930-х годов их так и называли, пока английский статистик [[Фишер, Рональд Эйлмер|Фишер]] не предложил название '''кумулянты''' ({{lang-en|cumulants}}), ввиду их кумулятивных свойств, и со временем именно это название и закрепилось в литературе. Тем не менее, в русскоязычной литературе предпочтение всегда отдавалось оригинальному названию, например [[Ширяев, Альберт Николаевич|Ширяев]] использует только лишь оригинальное латинское название. Для обозначения полуинвариант почти всегда используется греческая буква <math>\kappa</math>, хотя, например, Ширяев использует <math>\zeta</math>.
-Несмотря на то, что введены полуинварианты были давно, им уделяли очень мало внимания; только лишь в конце 1930-х годов Фишер впервые провёл систематическое исследование полуинвариантов.
+Несмотря на то, что введены полуинварианты были давно, им уделяли очень мало внимания: только лишь в конце 1930-х годов [[Фишер Рональд Эймлер|Фишер]] впервые провёл систематическое исследование полуинвариантов.
-На сегодняшний день, полуинварианты прочно вошли в мир современной статистики и её приложений. В частности, они очень широко используются в области обработки сигналов, что связано с некоторыми их полезными свойствами: например, все полуинварианты третьего и более высоких порядков равны нулю для нормальных процессов, а смешанные полуинварианты всех порядков статистически независимых величин равны нулю. Используя понятие полуинвариантов, можно ввести более общее понятие статистической независимости двух величин до ''n''-ого порядка, подразумевая под этим то, что все смешанные полуинварианты порядка до ''n'' (включительно) равны нулю.
+На сегодняшний день полуинварианты прочно вошли в мир современной [[Математическая статистика|статистики]] и её приложений. В частности они очень широко используются в области обработки сигналов, что связано с некоторыми их полезными свойствами: например, все полуинварианты третьего и более высоких порядков равны нулю для нормальных процессов, а смешанные полуинварианты всех порядков статистически независимых величин равны нулю. Используя понятие полуинвариантов, можно ввести более общее понятие статистической независимости двух величин до <math>n</math>-го порядка, подразумевая под этим то, что все смешанные полуинварианты порядка до <math>n</math> (включительно) равны нулю.
+== Примечания ==
+{{примечания}}
+{{нет ссылок|дата=8 июня 2019}}
-[[Категория:Теория вероятностей]]
+[[Категория:Теория вероятностей]]
-[[ja:キュムラント母関数]]

Полуинвариант (теория вероятностей): различия между версиями

Текущая версия от 23:19, 24 декабря 2024

Содержание

Определение

Через характеристическую функцию

Через моменты

История

Примечания

Навигация

Полуинвариант (теория вероятностей): различия между версиями

Текущая версия от 23:19, 24 декабря 2024

Определение

Через характеристическую функцию

Через моменты

История

Примечания

Навигация

Поиск