Полуинвариант (теория вероятностей): различия между версиями

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску
[непроверенная версия][непроверенная версия]
Содержимое удалено Содержимое добавлено
Нет описания правки
Коррекция грамматики
 
(не показано 80 промежуточных версий 41 участника)
Строка 1: Строка 1:
'''Полуинварианты''', или '''семиинварианты''', или '''кумулянты''' — [[Коэффициент|коэффициенты]] в разложении [[Логарифм|логарифма]] [[Характеристическая функция случайной величины|характеристической функции случайной величины]] в [[Ряд Тейлора|ряд Маклорена]]<ref name = ПрохоровРозанов>Прохоров Ю. В., Розанов Ю. А. Теория вероятностей (Основные понятия. Предельные теоремы. Случайные процессы) — М.: Главная редакция физико-математической литературы изд-ва «Наука», 1973. - 496 стр. </ref>.
==Общие сведения==


== Определение ==
'''Полуинварианты''' или '''кумулянты''' были введены датским астрономом и математиком [[Торвальд_Николай_Тиле|Торвальдом
Николаем Тиле]] в 1989 году (по другим данным в 1903 году).
Заметим что в русском языке иногда также используется название '''семиинварианты''' (от латинского semi- т.е полу-, половина), но оно в принципе не может считаться правильным, т.к. в русском
языке всё-таки не говорят семипроводник, ни семикондуктор, а говорят полупроводник. Тиле называл эти
статистические величины полуинвариантами (лат. semi-invariant) и до 30-ых годов XX-ого столетия их так и называли, но в 30-ых годах английский статистик Фишер предпочёл использовать название кумулянты (анг. cumulants), ввиду их кумулятивных, т.е. накопительных свойств, и со временем именно это название и закрепилось в литературе. Тем не менее, в русскоязычной литературе, предпочтение всегда отдавалось оригинальному названию, например Ширяев использует только лишь оригинальное
латинское название. Кстати, для обозначения полуинвариант почти всегда используется греческая буква
κ, хотя Ширяев использует ξ.


=== Через характеристическую функцию ===
Несмотря на то что введены полуинварианты были давно,
{{стиль}}
до 30-ых годов XX-ого века им уделяли очень мало внимания. В конце 30-ых годов английский учёный, сэр
Полуинварианты, в отличие от [[Моменты случайной величины|моментов]], не могут быть определены напрямую через [[Функция распределения|функцию распределения]] <math>p(x)</math>. Их определяют либо через логарифм характеристической функции <math>G(u)</math>, либо через моменты <math>\mu</math> (второе определение вытекает из первого). Формально, полуинварианты определяются как коэффициенты в разложении в ряд Маклорена логарифма характеристической функции аналогично тому, как определяются моменты для самой характеристической функции:
Рональд Эйльмер Фишер (анг. Sir Ronald Aylmer Fisher) впервые провёл систематическое исследование полуинвариант, а также, способа их оценки, известного как ''k-статистики'' (анг. k-statistics).
На сегодняшний день, полуинварианты прочно вошли в мир современной статистики и её приложений;
в частности, они очень широко используются в области обработки сигналов. Последнее легко понять,
т.к. например все полуинварианты третьего и более высоких порядков равны нулю для нормальных
процессов, смешанные полуинварианты всех порядков статистически независимых величин равны нулю, и пр. Кстати, последнее свойство практически теперь ложится в основу определения статистической независимости: вместо стандартного определения независимости через функцию распределения
часто говорят о статистической независимости двух величин до n-ого порядка, подразумевая под этим не вышеупомянутое определение, а то, что все смешанные полуинварианты порядка до n (включительно) равны нулю.


: <math>\ln G(u) \, = \, iu\kappa_1 + \frac{(iu)^2}{2!}\kappa_2 + \ldots +\frac{(iu)^n}{n!} \kappa_n + \ldots = \sum\limits_{n=1}^{\infty}\frac{(iu)^n}{n!} \kappa_n</math>.


Единственное отличие состоит в том, что первый член этого ряда принимается равным <math>0
</math>, а не <math>1
</math> как в случае моментов. Поэтому логарифм характеристической функции является производящей функцией для полуинвариантов, его иногда называют ''второй характеристической функцией'' и обозначают:


: <math>\varphi(u)\,\equiv\,\ln G(u)</math>.
==Определение через характеристическую функцию==
Полуинварианты, в отличие от моментов, не могут быть определены напрямую через функцию распределения p(x). Их определяют либо через моменты, либо через логарифм характеристической функции ln G(u) (обычно делается последнее). Формально, полуинварианты определяются как коэффициэнты в разложении в ряд МакЛорена логарифма характеристической функции, образом, в точности аналогичному тому, которым были моменты для самой характеристической функции, т.е. с вынесенными
вперёд коэффициэнтами <math>i^n</math>:


Интерес к этой функции обусловлен тем, что она [[Аддитивность (математика)|аддитивна]] для независимых случайных величин, то есть для суммы таких величин она равна сумме соответствующих функций для каждой величины:
<math>\ln G(u) \, = \, iu\kappa_1 + \frac{(iu)^2}{2!}\kappa_2 + \ldots +\frac{(iu)^n}{n!} \kappa_n + \ldots = \sum\limits_{n=1}^{\infty}\frac{(iu)^n}{n!} \kappa_n</math>


: <math>\ln G(a+b) = \ln G(a)+\ln G(b)</math>.
Единственное разница состоит в том что первый член этого ряда полагается равным 0, а не 1 как было для моментов. Кстати, сам логарифм характеристической функции, ввиду важности полуинвариант генерирующей функцией которых он является, также получил отдельное название, его иногда называют ''второй характеристической функцей'', и даже через что-нибудь такое обазначают, например:


Это очевидно следует из того факта, что характеристическая [[мультипликативная функция]] по независимым случайным величинам равна произведению соответствующих функций. Это же свойство, как следствие, присуще полуинвариантам: в частности, поскольку первым и вторым полуинвариантом случайной величины служат её [[математическое ожидание]] и [[Дисперсия случайной величины|дисперсия]], то для суммы независимых случайных величин они соответственно равны сумме математических ожиданий или дисперсий самих величин (это верно и для [[Моменты случайной величины|третьего центрального момента]], который поэтому совпадает с третьим полуинвариантом. Для четвёртых и более высоких центрированных моментов это равенство уже не выполняется). Указанное свойство упрощает работу с кумулянтами, так как для них, в отличие от моментов распределения суммы независимых случайных величин, имеющих достаточно громоздкое выражение через моменты самих величин, выражение через полуинварианты слагаемых весьма просто.
<math>\varphi(u)\,\equiv\,\ln G(u)</math>
Из определения ряда Маклорена полуинвариант порядка <math>n</math> определяется как:


: <math>\kappa_n \,=\, (-i)^n \left.\frac{\,\partial^n\varphi}{\,\partial u^n}\right|_{u=0}</math>.
Тогда, очевидно что из определения ряда МакЛорена, полуинварианта порядка n будет определена как:


В частности, для первого полуинварианта имеем:
<math>\kappa_n \,=\, (-i)^n \left.\frac{\,\partial^n\varphi}{\,\partial u^n}\right|_{u=0}</math>


: <math>\kappa_1 \,=\, -i \left.\frac{\,\partial\varphi}{\,\partial u}\right|_{u=0}\,=\,-i \left.\frac{G'_u}{\,G(u)}\right|_{u=0}</math>.
и для первой полуинварианты всё намного проще:


=== Через моменты ===
<math>\kappa_1 \,=\, -i \left.\frac{\,\partial\varphi}{\,\partial u}\right|_{u=0}\,=\,-i \left.\frac{G'_u}{\,G(u)}\right|_{u=0}</math>
Выведем теперь альтернативное определение полуинварианта через моменты. Разлагая характеристическую функцию <math>G(u)</math> в ряд Маклорена через моменты, можно переписать первую формулу в следующем виде:


: <math>\ln \left\{1+\sum\limits_{n=1}^{\infty}\frac{(iu)^n}{n!} \mu_n \right\} \, = \,\sum\limits_{n=1}^{\infty}\frac{(iu)^n}{n!} \kappa_n</math>.
Две последние формулы и есть определение полуинвариантов через характеристическую функцию.


Разлагая и логарифм в ряд Маклорена и предполагая, что условия на его [[радиус сходимости]] выполняются, мы получим:


: <math>\sum\limits_{m=1}^{\infty}(-1)^{m+1}\frac{\displaystyle\left(\sum\limits_{n=1}^{\infty}\frac{(iu)^n}{n!} \mu_n \right)^{\!\!m} }{m} \,=\,\sum\limits_{n=1}^{\infty}\frac{(iu)^n}{n!} \kappa_n</math>.


Приравнивая коэффициенты при равных степенях <math>iu</math> в суммах слева и справа, получаем:
==Определение через моменты==
Выведем теперь альтернативное определение полуинвариантов через моменты. Разлагая характеристическую функцию G(u) в ряд МакЛорена через моменты, мы можем написать:


: <math>\begin{cases}
<math>\ln \left\{1+\sum\limits_{n=1}^{\infty}\frac{(iu)^n}{n!} \mu_n \right\} \, = \,\sum\limits_{n=1}^{\infty}\frac{(iu)^n}{n!} \kappa_n</math>
\kappa_1=\mu_1 \\[1mm]
\kappa_2=-\mu^2_1+\mu_2 \\[1mm]
\kappa_3=2\mu^3_1-3\mu_1\mu_2 +\mu_3 \\[1mm]
\;\ldots
\end{cases}</math>.


Интересный метод, основанный на производной для более простого отыскания этих взаимоотношений, а также эти выражения для более высоких порядков описаны у Кендалла. Он также даёт общую формулу для поиска [[Моменты случайной величины|моментов]] через полуинварианты и обратно, эта же формула встречается и у [[Ширяев, Альберт Николаевич|Ширяева]]. Кстати, эту общую формулу в некоторой литературе так и называют формулой Ширяева-Леонтьева, хотя по всей видимости они не были первыми, кто её вывел.
Теперь, разлагая и логарифм в ряд МакЛорена, и предполагая что условия на его радиус сходимости
выполняются, мы получим:


== История ==
<math>\sum\limits_{m=1}^{\infty}(-1)^{m+1}\frac{\displaystyle\left(\sum\limits_{n=1}^{\infty}\frac{(iu)^n}{n!} \mu_n \right)^{\!\!m} }{m} \,=\,\sum\limits_{n=1}^{\infty}\frac{(iu)^n}{n!} \kappa_n</math>


'''Полуинварианты''' были введены датским астрономом и математиком [[Торвальд Николай Тиле|Торвальдом Николаем Тиле]] в 1889 году (по другим данным в 1903 году). В русском языке также используется название '''семиинварианты''' (от латинского semi-, что означает полу-, половина). Тиле назвал эти статистические величины полуинвариантами (semi-invariant), и до 1930-х годов их так и называли, пока английский статистик [[Фишер, Рональд Эйлмер|Фишер]] не предложил название '''кумулянты''' ({{lang-en|cumulants}}), ввиду их кумулятивных свойств, и со временем именно это название и закрепилось в литературе. Тем не менее, в русскоязычной литературе предпочтение всегда отдавалось оригинальному названию, например [[Ширяев, Альберт Николаевич|Ширяев]] использует только лишь оригинальное латинское название. Для обозначения полуинвариант почти всегда используется греческая буква <math>\kappa</math>, хотя, например, Ширяев использует <math>\zeta</math>.
Далее надо аккуратно расписать все члены стоящие в суммах слева и справа и попросту приравнять
коэффициенты при равных степенях iu. Тогда мы легко получим следующие выражения:


Несмотря на то, что введены полуинварианты были давно, им уделяли очень мало внимания: только лишь в конце 1930-х годов [[Фишер Рональд Эймлер|Фишер]] впервые провёл систематическое исследование полуинвариантов.
<math>\begin{cases}

\kappa_1=\mu_1 \\[1mm]
На сегодняшний день полуинварианты прочно вошли в мир современной [[Математическая статистика|статистики]] и её приложений. В частности они очень широко используются в области обработки сигналов, что связано с некоторыми их полезными свойствами: например, все полуинварианты третьего и более высоких порядков равны нулю для нормальных процессов, а смешанные полуинварианты всех порядков статистически независимых величин равны нулю. Используя понятие полуинвариантов, можно ввести более общее понятие статистической независимости двух величин до <math>n</math>-го порядка, подразумевая под этим то, что все смешанные полуинварианты порядка до <math>n</math> (включительно) равны нулю.
\kappa_2=-\mu^2_1+\mu_2 \\[1mm]

\kappa_3=2\mu^3_1-3\mu_1\mu_2 +\mu_3 \\[1mm]
== Примечания ==
\kappa_4=\kappa^4_1+6\kappa^2_1\kappa_2 +3\kappa^2_2+4\kappa_1\kappa_3 +\kappa_4 \\[1mm]
{{примечания}}
\kappa_5=\kappa^5_1+10\kappa^3_1\kappa_2+15\kappa_1\kappa^2_2 +10\kappa^2_1\kappa_3 +
10\kappa_2\kappa_3+5\kappa_1\kappa_4+\kappa_5\\[1mm]
\;\ldots\ldots\ldots\ldots\ldots\ldots\ldots\ldots\ldots\ldots\ldots\ldots\ldots\ldots
\end{cases}</math>


{{нет ссылок|дата=8 июня 2019}}
Ну правда „легко“ на этом и кончается, и затем всё очень сильно усложняется. Интересный метод основанный на производной для более простого отыскания этих взаимоотношений, а также эти выражения для более высоких порядков описаны у Кендалла. Он также даёт общую формулу для отысканий
моментов через полуинварианты и обратно, эта же формула встречается и у Ширяева. Кстати, эту общую формулу в некоторой литературе так и называют формулой Ширяева-Леонтьева, хотя по всей видимости они не были первыми кто её вывели.


[[Категория:Теория вероятностей]]
[[de:Kumulante]]
[[en:Cumulant]]
[[pl:Kumulanta]]
[[pt:Cumulante]]
[[tr:Kümülant]]

Текущая версия от 23:19, 24 декабря 2024

Полуинварианты, или семиинварианты, или кумулянты — коэффициенты в разложении логарифма характеристической функции случайной величины в ряд Маклорена[1].

Определение

[править | править код]

Через характеристическую функцию

[править | править код]

Полуинварианты, в отличие от моментов, не могут быть определены напрямую через функцию распределения . Их определяют либо через логарифм характеристической функции , либо через моменты (второе определение вытекает из первого). Формально, полуинварианты определяются как коэффициенты в разложении в ряд Маклорена логарифма характеристической функции аналогично тому, как определяются моменты для самой характеристической функции:

.

Единственное отличие состоит в том, что первый член этого ряда принимается равным , а не как в случае моментов. Поэтому логарифм характеристической функции является производящей функцией для полуинвариантов, его иногда называют второй характеристической функцией и обозначают:

.

Интерес к этой функции обусловлен тем, что она аддитивна для независимых случайных величин, то есть для суммы таких величин она равна сумме соответствующих функций для каждой величины:

.

Это очевидно следует из того факта, что характеристическая мультипликативная функция по независимым случайным величинам равна произведению соответствующих функций. Это же свойство, как следствие, присуще полуинвариантам: в частности, поскольку первым и вторым полуинвариантом случайной величины служат её математическое ожидание и дисперсия, то для суммы независимых случайных величин они соответственно равны сумме математических ожиданий или дисперсий самих величин (это верно и для третьего центрального момента, который поэтому совпадает с третьим полуинвариантом. Для четвёртых и более высоких центрированных моментов это равенство уже не выполняется). Указанное свойство упрощает работу с кумулянтами, так как для них, в отличие от моментов распределения суммы независимых случайных величин, имеющих достаточно громоздкое выражение через моменты самих величин, выражение через полуинварианты слагаемых весьма просто.

Из определения ряда Маклорена полуинвариант порядка определяется как:

.

В частности, для первого полуинварианта имеем:

.

Через моменты

[править | править код]

Выведем теперь альтернативное определение полуинварианта через моменты. Разлагая характеристическую функцию в ряд Маклорена через моменты, можно переписать первую формулу в следующем виде:

.

Разлагая и логарифм в ряд Маклорена и предполагая, что условия на его радиус сходимости выполняются, мы получим:

.

Приравнивая коэффициенты при равных степенях в суммах слева и справа, получаем:

.

Интересный метод, основанный на производной для более простого отыскания этих взаимоотношений, а также эти выражения для более высоких порядков описаны у Кендалла. Он также даёт общую формулу для поиска моментов через полуинварианты и обратно, эта же формула встречается и у Ширяева. Кстати, эту общую формулу в некоторой литературе так и называют формулой Ширяева-Леонтьева, хотя по всей видимости они не были первыми, кто её вывел.

Полуинварианты были введены датским астрономом и математиком Торвальдом Николаем Тиле в 1889 году (по другим данным в 1903 году). В русском языке также используется название семиинварианты (от латинского semi-, что означает полу-, половина). Тиле назвал эти статистические величины полуинвариантами (semi-invariant), и до 1930-х годов их так и называли, пока английский статистик Фишер не предложил название кумулянты (англ. cumulants), ввиду их кумулятивных свойств, и со временем именно это название и закрепилось в литературе. Тем не менее, в русскоязычной литературе предпочтение всегда отдавалось оригинальному названию, например Ширяев использует только лишь оригинальное латинское название. Для обозначения полуинвариант почти всегда используется греческая буква , хотя, например, Ширяев использует .

Несмотря на то, что введены полуинварианты были давно, им уделяли очень мало внимания: только лишь в конце 1930-х годов Фишер впервые провёл систематическое исследование полуинвариантов.

На сегодняшний день полуинварианты прочно вошли в мир современной статистики и её приложений. В частности они очень широко используются в области обработки сигналов, что связано с некоторыми их полезными свойствами: например, все полуинварианты третьего и более высоких порядков равны нулю для нормальных процессов, а смешанные полуинварианты всех порядков статистически независимых величин равны нулю. Используя понятие полуинвариантов, можно ввести более общее понятие статистической независимости двух величин до -го порядка, подразумевая под этим то, что все смешанные полуинварианты порядка до (включительно) равны нулю.

Примечания

[править | править код]
  1. Прохоров Ю. В., Розанов Ю. А. Теория вероятностей (Основные понятия. Предельные теоремы. Случайные процессы) — М.: Главная редакция физико-математической литературы изд-ва «Наука», 1973. - 496 стр.