Полуинвариант (теория вероятностей): различия между версиями

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску
[непроверенная версия][непроверенная версия]
Содержимое удалено Содержимое добавлено
Коррекция грамматики
 
(не показана 51 промежуточная версия 29 участников)
Строка 1: Строка 1:
'''Полуинварианты''', или '''семиинварианты''', или '''кумулянты''' — [[Коэффициент|коэффициенты]] в разложении [[Логарифм|логарифма]] [[Характеристическая функция случайной величины|характеристической функции случайной величины]] в [[Ряд Тейлора|ряд Маклорена]]<ref name = ПрохоровРозанов>Прохоров Ю. В., Розанов Ю. А. Теория вероятностей (Основные понятия. Предельные теоремы. Случайные процессы) — М.: Главная редакция физико-математической литературы изд-ва «Наука», 1973. - 496 стр. </ref>.
{{стиль}}
== Общие сведения ==


== Определение ==
'''Полуинварианты''' или '''кумулянты''' были введены датским астрономом и математиком [[Торвальд Николай Тиле|Торвальдом
Николаем Тиле]] в 1889 году (по другим данным в 1903 году).
Заметим что в русском языке иногда также используется название '''семиинварианты''' (от латинского semi- т.е полу-, половина), но оно в принципе не может считаться правильным, т.к. в русском
языке всё-таки не говорят семипроводник или семикондуктор, а говорят полупроводник. Тиле называл эти
статистические величины полуинвариантами (semi-invariant) и до 30-х годов XX-ого столетия их так и называли, но в 30-х годах английский статистик Фишер предпочёл использовать название кумулянты (анг. cumulants), ввиду их кумулятивных, т.е. накопительных свойств, и со временем именно это название и закрепилось в литературе. Тем не менее, в русскоязычной литературе, предпочтение всегда отдавалось оригинальному названию, например [[Ширяев, Альберт Николаевич|Ширяев]] использует только лишь оригинальное
латинское название. Кстати, для обозначения полуинвариант почти всегда используется греческая буква
κ, хотя [[Ширяев, Альберт Николаевич|Ширяев]] использует ξ.


=== Через характеристическую функцию ===
Несмотря на то что введены полуинварианты были давно,
{{стиль}}
до 30-х годов XX-ого века им уделяли очень мало внимания; только лишь в конце 30-х годов английский учёный, сэр
Полуинварианты, в отличие от [[Моменты случайной величины|моментов]], не могут быть определены напрямую через [[Функция распределения|функцию распределения]] <math>p(x)</math>. Их определяют либо через логарифм характеристической функции <math>G(u)</math>, либо через моменты <math>\mu</math> (второе определение вытекает из первого). Формально, полуинварианты определяются как коэффициенты в разложении в ряд Маклорена логарифма характеристической функции аналогично тому, как определяются моменты для самой характеристической функции:
Рональд Эйльмер Фишер (анг. Sir Ronald Aylmer Fisher) впервые провёл систематическое исследование полуинвариант.
На сегодняшний день, полуинварианты прочно вошли в мир современной статистики и её приложений;
в частности, они очень широко используются в области обработки сигналов. Последнее легко понять,
т.к. например все полуинварианты третьего и более высоких порядков равны нулю для нормальных
процессов, смешанные полуинварианты всех порядков статистически независимых величин равны нулю, и пр. Кстати, последнее свойство практически теперь ложится в основу определения статистической независимости: вместо стандартного определения независимости через функцию распределения
часто говорят о статистической независимости двух величин до n-ого порядка, подразумевая под этим не вышеупомянутое определение, а то, что все смешанные полуинварианты порядка до n (включительно) равны нулю.


: <math>\ln G(u) \, = \, iu\kappa_1 + \frac{(iu)^2}{2!}\kappa_2 + \ldots +\frac{(iu)^n}{n!} \kappa_n + \ldots = \sum\limits_{n=1}^{\infty}\frac{(iu)^n}{n!} \kappa_n</math>.
== Определение через характеристическую функцию ==
Полуинварианты, в отличие от моментов, не могут быть определены напрямую через функцию распределения p(x). Их определяют либо через логарифм характеристической функции G(u), либо через моменты μ (второе определение на самом деле вытекает из первого). Формально, полуинварианты определяются как коэффициенты в разложении в ряд МакЛорена логарифма характеристической функции, образом, в точности аналогичному тому, которым есть моменты для самой [[Характеристическая функция случайной величины|характеристической функции]], т.е. с вынесенными
вперёд коэффициентами <math>i^n</math>:


Единственное отличие состоит в том, что первый член этого ряда принимается равным <math>0
<math>\ln G(u) \, = \, iu\kappa_1 + \frac{(iu)^2}{2!}\kappa_2 + \ldots +\frac{(iu)^n}{n!} \kappa_n + \ldots = \sum\limits_{n=1}^{\infty}\frac{(iu)^n}{n!} \kappa_n</math>
</math>, а не <math>1
</math> как в случае моментов. Поэтому логарифм характеристической функции является производящей функцией для полуинвариантов, его иногда называют ''второй характеристической функцией'' и обозначают:


: <math>\varphi(u)\,\equiv\,\ln G(u)</math>.
Единственная разница состоит в том что первый член этого ряда полагается равным 0, а не 1 как это есть для моментов. Кстати, сам логарифм характеристической функции, ввиду важности полуинвариант, генерирующей функцией которых он является, также получил отдельное название, его иногда называют ''второй характеристической функцей'' и вводят специальное обозначение, например:


Интерес к этой функции обусловлен тем, что она [[Аддитивность (математика)|аддитивна]] для независимых случайных величин, то есть для суммы таких величин она равна сумме соответствующих функций для каждой величины:
<math>\varphi(u)\,\equiv\,\ln G(u)</math>


: <math>\ln G(a+b) = \ln G(a)+\ln G(b)</math>.
Тогда очевидно, что из определения ряда МакЛорена, полуинварианта порядка n будет определена как:


Это очевидно следует из того факта, что характеристическая [[мультипликативная функция]] по независимым случайным величинам равна произведению соответствующих функций. Это же свойство, как следствие, присуще полуинвариантам: в частности, поскольку первым и вторым полуинвариантом случайной величины служат её [[математическое ожидание]] и [[Дисперсия случайной величины|дисперсия]], то для суммы независимых случайных величин они соответственно равны сумме математических ожиданий или дисперсий самих величин (это верно и для [[Моменты случайной величины|третьего центрального момента]], который поэтому совпадает с третьим полуинвариантом. Для четвёртых и более высоких центрированных моментов это равенство уже не выполняется). Указанное свойство упрощает работу с кумулянтами, так как для них, в отличие от моментов распределения суммы независимых случайных величин, имеющих достаточно громоздкое выражение через моменты самих величин, выражение через полуинварианты слагаемых весьма просто.
<math>\kappa_n \,=\, (-i)^n \left.\frac{\,\partial^n\varphi}{\,\partial u^n}\right|_{u=0}</math>
Из определения ряда Маклорена полуинвариант порядка <math>n</math> определяется как:


: <math>\kappa_n \,=\, (-i)^n \left.\frac{\,\partial^n\varphi}{\,\partial u^n}\right|_{u=0}</math>.
и для первой полуинварианты всё намного проще:


В частности, для первого полуинварианта имеем:
<math>\kappa_1 \,=\, -i \left.\frac{\,\partial\varphi}{\,\partial u}\right|_{u=0}\,=\,-i \left.\frac{G'_u}{\,G(u)}\right|_{u=0}</math>.


: <math>\kappa_1 \,=\, -i \left.\frac{\,\partial\varphi}{\,\partial u}\right|_{u=0}\,=\,-i \left.\frac{G'_u}{\,G(u)}\right|_{u=0}</math>.
== Определение через моменты ==
Выведем теперь альтернативное определение полуинвариант через моменты. Разлагая характеристическую функцию G(u) в ряд МакЛорена через моменты, мы можем переписать первую формулу в следующем виде:


=== Через моменты ===
<math>\ln \left\{1+\sum\limits_{n=1}^{\infty}\frac{(iu)^n}{n!} \mu_n \right\} \, = \,\sum\limits_{n=1}^{\infty}\frac{(iu)^n}{n!} \kappa_n</math>
Выведем теперь альтернативное определение полуинварианта через моменты. Разлагая характеристическую функцию <math>G(u)</math> в ряд Маклорена через моменты, можно переписать первую формулу в следующем виде:


: <math>\ln \left\{1+\sum\limits_{n=1}^{\infty}\frac{(iu)^n}{n!} \mu_n \right\} \, = \,\sum\limits_{n=1}^{\infty}\frac{(iu)^n}{n!} \kappa_n</math>.
Теперь, разлагая и логарифм в ряд МакЛорена, и предполагая что условия на его радиус сходимости
выполняются, мы получим:


Разлагая и логарифм в ряд Маклорена и предполагая, что условия на его [[радиус сходимости]] выполняются, мы получим:
<math>\sum\limits_{m=1}^{\infty}(-1)^{m+1}\frac{\displaystyle\left(\sum\limits_{n=1}^{\infty}\frac{(iu)^n}{n!} \mu_n \right)^{\!\!m} }{m} \,=\,\sum\limits_{n=1}^{\infty}\frac{(iu)^n}{n!} \kappa_n</math>


: <math>\sum\limits_{m=1}^{\infty}(-1)^{m+1}\frac{\displaystyle\left(\sum\limits_{n=1}^{\infty}\frac{(iu)^n}{n!} \mu_n \right)^{\!\!m} }{m} \,=\,\sum\limits_{n=1}^{\infty}\frac{(iu)^n}{n!} \kappa_n</math>.
Далее надо аккуратно расписать все члены стоящие в суммах слева и справа и попросту приравнять
коэффициенты при равных степенях iu. Тогда мы легко получим следующие выражения:


Приравнивая коэффициенты при равных степенях <math>iu</math> в суммах слева и справа, получаем:
<math>\begin{cases}

: <math>\begin{cases}
\kappa_1=\mu_1 \\[1mm]
\kappa_1=\mu_1 \\[1mm]
\kappa_2=-\mu^2_1+\mu_2 \\[1mm]
\kappa_2=-\mu^2_1+\mu_2 \\[1mm]
\kappa_3=2\mu^3_1-3\mu_1\mu_2 +\mu_3 \\[1mm]
\kappa_3=2\mu^3_1-3\mu_1\mu_2 +\mu_3 \\[1mm]
\;\ldots
\;\ldots\ldots\ldots\ldots\ldots\ldots\ldots
\end{cases}</math>
\end{cases}</math>.


Ну правда „легко“ на этом и кончается, и затем всё очень сильно усложняется. Интересный метод основанный на производной для более простого отыскания этих взаимоотношений, а также эти выражения для более высоких порядков описаны у Кендалла. Он также даёт общую формулу для отысканий
Интересный метод, основанный на производной для более простого отыскания этих взаимоотношений, а также эти выражения для более высоких порядков описаны у Кендалла. Он также даёт общую формулу для поиска [[Моменты случайной величины|моментов]] через полуинварианты и обратно, эта же формула встречается и у [[Ширяев, Альберт Николаевич|Ширяева]]. Кстати, эту общую формулу в некоторой литературе так и называют формулой Ширяева-Леонтьева, хотя по всей видимости они не были первыми, кто её вывел.
моментов через полуинварианты и обратно, эта же формула встречается и у Ширяева. Кстати, эту общую формулу в некоторой литературе так и называют формулой Ширяева-Леонтьева, хотя по всей видимости они не были первыми кто её вывели.


== История ==
[[Категория:Теория вероятностей]]


'''Полуинварианты''' были введены датским астрономом и математиком [[Торвальд Николай Тиле|Торвальдом Николаем Тиле]] в 1889 году (по другим данным в 1903 году). В русском языке также используется название '''семиинварианты''' (от латинского semi-, что означает полу-, половина). Тиле назвал эти статистические величины полуинвариантами (semi-invariant), и до 1930-х годов их так и называли, пока английский статистик [[Фишер, Рональд Эйлмер|Фишер]] не предложил название '''кумулянты''' ({{lang-en|cumulants}}), ввиду их кумулятивных свойств, и со временем именно это название и закрепилось в литературе. Тем не менее, в русскоязычной литературе предпочтение всегда отдавалось оригинальному названию, например [[Ширяев, Альберт Николаевич|Ширяев]] использует только лишь оригинальное латинское название. Для обозначения полуинвариант почти всегда используется греческая буква <math>\kappa</math>, хотя, например, Ширяев использует <math>\zeta</math>.
[[de:Kumulante]]

[[en:Cumulant]]
Несмотря на то, что введены полуинварианты были давно, им уделяли очень мало внимания: только лишь в конце 1930-х годов [[Фишер Рональд Эймлер|Фишер]] впервые провёл систематическое исследование полуинвариантов.
[[fr:Cumulants (statistiques)]]

[[pl:Kumulanta]]
На сегодняшний день полуинварианты прочно вошли в мир современной [[Математическая статистика|статистики]] и её приложений. В частности они очень широко используются в области обработки сигналов, что связано с некоторыми их полезными свойствами: например, все полуинварианты третьего и более высоких порядков равны нулю для нормальных процессов, а смешанные полуинварианты всех порядков статистически независимых величин равны нулю. Используя понятие полуинвариантов, можно ввести более общее понятие статистической независимости двух величин до <math>n</math>-го порядка, подразумевая под этим то, что все смешанные полуинварианты порядка до <math>n</math> (включительно) равны нулю.
[[pt:Cumulante]]

[[sl:Kumulanta]]
== Примечания ==
[[tr:Kümülant]]
{{примечания}}

{{нет ссылок|дата=8 июня 2019}}

[[Категория:Теория вероятностей]]

Текущая версия от 23:19, 24 декабря 2024

Полуинварианты, или семиинварианты, или кумулянты — коэффициенты в разложении логарифма характеристической функции случайной величины в ряд Маклорена[1].

Определение

[править | править код]

Через характеристическую функцию

[править | править код]

Полуинварианты, в отличие от моментов, не могут быть определены напрямую через функцию распределения . Их определяют либо через логарифм характеристической функции , либо через моменты (второе определение вытекает из первого). Формально, полуинварианты определяются как коэффициенты в разложении в ряд Маклорена логарифма характеристической функции аналогично тому, как определяются моменты для самой характеристической функции:

.

Единственное отличие состоит в том, что первый член этого ряда принимается равным , а не как в случае моментов. Поэтому логарифм характеристической функции является производящей функцией для полуинвариантов, его иногда называют второй характеристической функцией и обозначают:

.

Интерес к этой функции обусловлен тем, что она аддитивна для независимых случайных величин, то есть для суммы таких величин она равна сумме соответствующих функций для каждой величины:

.

Это очевидно следует из того факта, что характеристическая мультипликативная функция по независимым случайным величинам равна произведению соответствующих функций. Это же свойство, как следствие, присуще полуинвариантам: в частности, поскольку первым и вторым полуинвариантом случайной величины служат её математическое ожидание и дисперсия, то для суммы независимых случайных величин они соответственно равны сумме математических ожиданий или дисперсий самих величин (это верно и для третьего центрального момента, который поэтому совпадает с третьим полуинвариантом. Для четвёртых и более высоких центрированных моментов это равенство уже не выполняется). Указанное свойство упрощает работу с кумулянтами, так как для них, в отличие от моментов распределения суммы независимых случайных величин, имеющих достаточно громоздкое выражение через моменты самих величин, выражение через полуинварианты слагаемых весьма просто.

Из определения ряда Маклорена полуинвариант порядка определяется как:

.

В частности, для первого полуинварианта имеем:

.

Через моменты

[править | править код]

Выведем теперь альтернативное определение полуинварианта через моменты. Разлагая характеристическую функцию в ряд Маклорена через моменты, можно переписать первую формулу в следующем виде:

.

Разлагая и логарифм в ряд Маклорена и предполагая, что условия на его радиус сходимости выполняются, мы получим:

.

Приравнивая коэффициенты при равных степенях в суммах слева и справа, получаем:

.

Интересный метод, основанный на производной для более простого отыскания этих взаимоотношений, а также эти выражения для более высоких порядков описаны у Кендалла. Он также даёт общую формулу для поиска моментов через полуинварианты и обратно, эта же формула встречается и у Ширяева. Кстати, эту общую формулу в некоторой литературе так и называют формулой Ширяева-Леонтьева, хотя по всей видимости они не были первыми, кто её вывел.

Полуинварианты были введены датским астрономом и математиком Торвальдом Николаем Тиле в 1889 году (по другим данным в 1903 году). В русском языке также используется название семиинварианты (от латинского semi-, что означает полу-, половина). Тиле назвал эти статистические величины полуинвариантами (semi-invariant), и до 1930-х годов их так и называли, пока английский статистик Фишер не предложил название кумулянты (англ. cumulants), ввиду их кумулятивных свойств, и со временем именно это название и закрепилось в литературе. Тем не менее, в русскоязычной литературе предпочтение всегда отдавалось оригинальному названию, например Ширяев использует только лишь оригинальное латинское название. Для обозначения полуинвариант почти всегда используется греческая буква , хотя, например, Ширяев использует .

Несмотря на то, что введены полуинварианты были давно, им уделяли очень мало внимания: только лишь в конце 1930-х годов Фишер впервые провёл систематическое исследование полуинвариантов.

На сегодняшний день полуинварианты прочно вошли в мир современной статистики и её приложений. В частности они очень широко используются в области обработки сигналов, что связано с некоторыми их полезными свойствами: например, все полуинварианты третьего и более высоких порядков равны нулю для нормальных процессов, а смешанные полуинварианты всех порядков статистически независимых величин равны нулю. Используя понятие полуинвариантов, можно ввести более общее понятие статистической независимости двух величин до -го порядка, подразумевая под этим то, что все смешанные полуинварианты порядка до (включительно) равны нулю.

Примечания

[править | править код]
  1. Прохоров Ю. В., Розанов Ю. А. Теория вероятностей (Основные понятия. Предельные теоремы. Случайные процессы) — М.: Главная редакция физико-математической литературы изд-ва «Наука», 1973. - 496 стр.