Полуинвариант (теория вероятностей): различия между версиями

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску
[отпатрулированная версия][непроверенная версия]
Содержимое удалено Содержимое добавлено
Addbot (обсуждение | вклад)
м Перемещение 8 интервики на Викиданные, d:q746007
Коррекция грамматики
 
(не показаны 23 промежуточные версии 21 участника)
Строка 1: Строка 1:
'''Полуинварианты''', или '''семиинварианты''', или '''кумулянты''' это коэффициенты в разложении логарифма [[Характеристическая функция случайной величины|характеристической функции случайной величины]] в [[Ряд Тейлора|ряд МакЛорена]].
'''Полуинварианты''', или '''семиинварианты''', или '''кумулянты''' [[Коэффициент|коэффициенты]] в разложении [[Логарифм|логарифма]] [[Характеристическая функция случайной величины|характеристической функции случайной величины]] в [[Ряд Тейлора|ряд Маклорена]]<ref name = ПрохоровРозанов>Прохоров Ю. В., Розанов Ю. А. Теория вероятностей (Основные понятия. Предельные теоремы. Случайные процессы) — М.: Главная редакция физико-математической литературы изд-ва «Наука», 1973. - 496 стр. </ref>.


== Определение ==
== Определение ==

=== Через характеристическую функцию ===
=== Через характеристическую функцию ===
{{стиль}}
{{стиль}}
Полуинварианты, в отличие от моментов, не могут быть определены напрямую через функцию распределения ''p''(''x''). Их определяют либо через логарифм характеристической функции ''G''(''u''), либо через моменты μ (второе определение, на самом деле, вытекает из первого). Формально, полуинварианты определяются как коэффициенты в разложении в ряд МакЛорена логарифма характеристической функции аналогично тому, как опреляются моменты для самой [[Характеристическая функция случайной величины|характеристической функции]]:
Полуинварианты, в отличие от [[Моменты случайной величины|моментов]], не могут быть определены напрямую через [[Функция распределения|функцию распределения]] <math>p(x)</math>. Их определяют либо через логарифм характеристической функции <math>G(u)</math>, либо через моменты <math>\mu</math> (второе определение вытекает из первого). Формально, полуинварианты определяются как коэффициенты в разложении в ряд Маклорена логарифма характеристической функции аналогично тому, как определяются моменты для самой характеристической функции:


:<math>\ln G(u) \, = \, iu\kappa_1 + \frac{(iu)^2}{2!}\kappa_2 + \ldots +\frac{(iu)^n}{n!} \kappa_n + \ldots = \sum\limits_{n=1}^{\infty}\frac{(iu)^n}{n!} \kappa_n</math>
: <math>\ln G(u) \, = \, iu\kappa_1 + \frac{(iu)^2}{2!}\kappa_2 + \ldots +\frac{(iu)^n}{n!} \kappa_n + \ldots = \sum\limits_{n=1}^{\infty}\frac{(iu)^n}{n!} \kappa_n</math>.


Единственное отличие состоит в том, что первый член этого ряда полагается равным 0, а не 1 как в случае моментов. Таким образом, логарифм характеристической функции является производящей функцией для полуинвариантов, его иногда называют ''второй характеристической функцей'' и обозначают:
Единственное отличие состоит в том, что первый член этого ряда принимается равным <math>0
</math>, а не <math>1
</math> как в случае моментов. Поэтому логарифм характеристической функции является производящей функцией для полуинвариантов, его иногда называют ''второй характеристической функцией'' и обозначают:


:<math>\varphi(u)\,\equiv\,\ln G(u).</math>
: <math>\varphi(u)\,\equiv\,\ln G(u)</math>.


Интерес к этой функции обусловлен тем, что она аддитивна для независимых случайных величин, т.е. для суммы таких величин она равна сумме соответстующих функций для каждой величины:
Интерес к этой функции обусловлен тем, что она [[Аддитивность (математика)|аддитивна]] для независимых случайных величин, то есть для суммы таких величин она равна сумме соответствующих функций для каждой величины:


:<math>\ln G(a+b) = \ln G(a)+\ln G(b).</math>
: <math>\ln G(a+b) = \ln G(a)+\ln G(b)</math>.


Это с очевидностью следует из того факта, что характеристическая функция мультипликативна по независимым случайным величинам (равна произведению соответствующих функций). Это же свойство, как следствие, присуще полуинвариантам: в частности, поскольку первым и вторым полуинвариантом случайной величины служат ее [[математическое ожидание]] и [[дисперсия]], то для суммы независимых случайных величин они соответственно равны сумме математических ожиданий или дисперсий самих величин. (Это верно и для [[Моменты случайной величины|третьего центральнного момента]], который поэтому совпадает с третьим полуинвариантом. Для четвертых и более высоких центрированных моментов это равенство уже не выполняется.) Указанное свойство упрощает работу с кумулянтами, так как для них, в отличие от моментов распределения суммы независимых случайных величин, имеющих достаточно громоздкое выражение через моменты самих величин, выражение через полуинвариатны слагаемых весьма просто.
Это очевидно следует из того факта, что характеристическая [[мультипликативная функция]] по независимым случайным величинам равна произведению соответствующих функций. Это же свойство, как следствие, присуще полуинвариантам: в частности, поскольку первым и вторым полуинвариантом случайной величины служат её [[математическое ожидание]] и [[Дисперсия случайной величины|дисперсия]], то для суммы независимых случайных величин они соответственно равны сумме математических ожиданий или дисперсий самих величин (это верно и для [[Моменты случайной величины|третьего центрального момента]], который поэтому совпадает с третьим полуинвариантом. Для четвёртых и более высоких центрированных моментов это равенство уже не выполняется). Указанное свойство упрощает работу с кумулянтами, так как для них, в отличие от моментов распределения суммы независимых случайных величин, имеющих достаточно громоздкое выражение через моменты самих величин, выражение через полуинварианты слагаемых весьма просто.
Из определения ряда МакЛорена полуинвариант порядка ''n'' определяется как:
Из определения ряда Маклорена полуинвариант порядка <math>n</math> определяется как:


:<math>\kappa_n \,=\, (-i)^n \left.\frac{\,\partial^n\varphi}{\,\partial u^n}\right|_{u=0}.</math>
: <math>\kappa_n \,=\, (-i)^n \left.\frac{\,\partial^n\varphi}{\,\partial u^n}\right|_{u=0}</math>.


В частности, для первого полуинварианта имеем:
В частности, для первого полуинварианта имеем:


:<math>\kappa_1 \,=\, -i \left.\frac{\,\partial\varphi}{\,\partial u}\right|_{u=0}\,=\,-i \left.\frac{G'_u}{\,G(u)}\right|_{u=0}.</math>
: <math>\kappa_1 \,=\, -i \left.\frac{\,\partial\varphi}{\,\partial u}\right|_{u=0}\,=\,-i \left.\frac{G'_u}{\,G(u)}\right|_{u=0}</math>.


=== Через моменты ===
=== Через моменты ===
Выведем теперь альтернативное определение полуинварианта через моменты. Разлагая характеристическую функцию ''G''(''u'') в ряд МакЛорена через моменты, можно переписать первую формулу в следующем виде:
Выведем теперь альтернативное определение полуинварианта через моменты. Разлагая характеристическую функцию <math>G(u)</math> в ряд Маклорена через моменты, можно переписать первую формулу в следующем виде:


:<math>\ln \left\{1+\sum\limits_{n=1}^{\infty}\frac{(iu)^n}{n!} \mu_n \right\} \, = \,\sum\limits_{n=1}^{\infty}\frac{(iu)^n}{n!} \kappa_n</math>
: <math>\ln \left\{1+\sum\limits_{n=1}^{\infty}\frac{(iu)^n}{n!} \mu_n \right\} \, = \,\sum\limits_{n=1}^{\infty}\frac{(iu)^n}{n!} \kappa_n</math>.


Разлагая и логарифм в ряд МакЛорена и предполагая, что условия на его радиус сходимости выполняются, мы получим:
Разлагая и логарифм в ряд Маклорена и предполагая, что условия на его [[радиус сходимости]] выполняются, мы получим:


:<math>\sum\limits_{m=1}^{\infty}(-1)^{m+1}\frac{\displaystyle\left(\sum\limits_{n=1}^{\infty}\frac{(iu)^n}{n!} \mu_n \right)^{\!\!m} }{m} \,=\,\sum\limits_{n=1}^{\infty}\frac{(iu)^n}{n!} \kappa_n</math>
: <math>\sum\limits_{m=1}^{\infty}(-1)^{m+1}\frac{\displaystyle\left(\sum\limits_{n=1}^{\infty}\frac{(iu)^n}{n!} \mu_n \right)^{\!\!m} }{m} \,=\,\sum\limits_{n=1}^{\infty}\frac{(iu)^n}{n!} \kappa_n</math>.


Приравнивая коэффициенты при равных степенях ''iu'' в суммах слева и справа, получаем:
Приравнивая коэффициенты при равных степенях <math>iu</math> в суммах слева и справа, получаем:


:<math>\begin{cases}
: <math>\begin{cases}
\kappa_1=\mu_1 \\[1mm]
\kappa_1=\mu_1 \\[1mm]
\kappa_2=-\mu^2_1+\mu_2 \\[1mm]
\kappa_2=-\mu^2_1+\mu_2 \\[1mm]
\kappa_3=2\mu^3_1-3\mu_1\mu_2 +\mu_3 \\[1mm]
\kappa_3=2\mu^3_1-3\mu_1\mu_2 +\mu_3 \\[1mm]
\;\ldots
\;\ldots
\end{cases}</math>
\end{cases}</math>.


Интересный метод основанный на производной для более простого отыскания этих взаимоотношений, а также эти выражения для более высоких порядков описаны у Кендалла. Он также даёт общую формулу для отысканий моментов через полуинварианты и обратно, эта же формула встречается и у [[Ширяев, Альберт Николаевич|Ширяева]]. Кстати, эту общую формулу в некоторой литературе так и называют формулой Ширяева—Леонтьева, хотя по всей видимости они не были первыми, кто её вывели.
Интересный метод, основанный на производной для более простого отыскания этих взаимоотношений, а также эти выражения для более высоких порядков описаны у Кендалла. Он также даёт общую формулу для поиска [[Моменты случайной величины|моментов]] через полуинварианты и обратно, эта же формула встречается и у [[Ширяев, Альберт Николаевич|Ширяева]]. Кстати, эту общую формулу в некоторой литературе так и называют формулой Ширяева-Леонтьева, хотя по всей видимости они не были первыми, кто её вывел.


== История ==
== История ==


'''Полуинварианты''' были введены датским астрономом и математиком [[Торвальд Николай Тиле|Торвальдом Николаем Тиле]] в 1889 году (по другим данным в 1903 году). В русском языке также используется название '''семиинварианты''' (от латинского semi-, что означает полу-, половина). Тиле назвал эти статистические величины полуинвариантами (semi-invariant), и до 1930-х годов их так и называли, пока английский статистик [[Фишер, Рональд Эйлмер|Фишер]] не предложил название '''кумулянты''' ({{lang-en|cumulants}}), ввиду их кумулятивных свойств, и со временем именно это название и закрепилось в литературе. Тем не менее, в русскоязычной литературе предпочтение всегда отдавалось оригинальному названию, например, [[Ширяев, Альберт Николаевич|Ширяев]] использует только лишь оригинальное латинское название. Для обозначения полуинвариант почти всегда используется греческая буква κ, хотя, например, Ширяев использует ξ.
'''Полуинварианты''' были введены датским астрономом и математиком [[Торвальд Николай Тиле|Торвальдом Николаем Тиле]] в 1889 году (по другим данным в 1903 году). В русском языке также используется название '''семиинварианты''' (от латинского semi-, что означает полу-, половина). Тиле назвал эти статистические величины полуинвариантами (semi-invariant), и до 1930-х годов их так и называли, пока английский статистик [[Фишер, Рональд Эйлмер|Фишер]] не предложил название '''кумулянты''' ({{lang-en|cumulants}}), ввиду их кумулятивных свойств, и со временем именно это название и закрепилось в литературе. Тем не менее, в русскоязычной литературе предпочтение всегда отдавалось оригинальному названию, например [[Ширяев, Альберт Николаевич|Ширяев]] использует только лишь оригинальное латинское название. Для обозначения полуинвариант почти всегда используется греческая буква <math>\kappa</math>, хотя, например, Ширяев использует <math>\zeta</math>.


Несмотря на то, что введены полуинварианты были давно, им уделяли очень мало внимания; только лишь в конце 1930-х годов Фишер впервые провёл систематическое исследование полуинвариантов.
Несмотря на то, что введены полуинварианты были давно, им уделяли очень мало внимания: только лишь в конце 1930-х годов [[Фишер Рональд Эймлер|Фишер]] впервые провёл систематическое исследование полуинвариантов.


На сегодняшний день, полуинварианты прочно вошли в мир современной статистики и её приложений. В частности, они очень широко используются в области обработки сигналов, что связано с некоторыми их полезными свойствами: например, все полуинварианты третьего и более высоких порядков равны нулю для нормальных процессов, а смешанные полуинварианты всех порядков статистически независимых величин равны нулю. Используя понятие полуинвариантов, можно ввести более общее понятие статистической независимости двух величин до ''n''-ого порядка, подразумевая под этим то, что все смешанные полуинварианты порядка до ''n'' (включительно) равны нулю.
На сегодняшний день полуинварианты прочно вошли в мир современной [[Математическая статистика|статистики]] и её приложений. В частности они очень широко используются в области обработки сигналов, что связано с некоторыми их полезными свойствами: например, все полуинварианты третьего и более высоких порядков равны нулю для нормальных процессов, а смешанные полуинварианты всех порядков статистически независимых величин равны нулю. Используя понятие полуинвариантов, можно ввести более общее понятие статистической независимости двух величин до <math>n</math>-го порядка, подразумевая под этим то, что все смешанные полуинварианты порядка до <math>n</math> (включительно) равны нулю.


== Примечания ==
{{примечания}}


{{нет ссылок|дата=8 июня 2019}}
[[Категория:Теория вероятностей]]


[[Категория:Теория вероятностей]]
[[ja:キュムラント母関数]]

Текущая версия от 23:19, 24 декабря 2024

Полуинварианты, или семиинварианты, или кумулянты — коэффициенты в разложении логарифма характеристической функции случайной величины в ряд Маклорена[1].

Определение

[править | править код]

Через характеристическую функцию

[править | править код]

Полуинварианты, в отличие от моментов, не могут быть определены напрямую через функцию распределения . Их определяют либо через логарифм характеристической функции , либо через моменты (второе определение вытекает из первого). Формально, полуинварианты определяются как коэффициенты в разложении в ряд Маклорена логарифма характеристической функции аналогично тому, как определяются моменты для самой характеристической функции:

.

Единственное отличие состоит в том, что первый член этого ряда принимается равным , а не как в случае моментов. Поэтому логарифм характеристической функции является производящей функцией для полуинвариантов, его иногда называют второй характеристической функцией и обозначают:

.

Интерес к этой функции обусловлен тем, что она аддитивна для независимых случайных величин, то есть для суммы таких величин она равна сумме соответствующих функций для каждой величины:

.

Это очевидно следует из того факта, что характеристическая мультипликативная функция по независимым случайным величинам равна произведению соответствующих функций. Это же свойство, как следствие, присуще полуинвариантам: в частности, поскольку первым и вторым полуинвариантом случайной величины служат её математическое ожидание и дисперсия, то для суммы независимых случайных величин они соответственно равны сумме математических ожиданий или дисперсий самих величин (это верно и для третьего центрального момента, который поэтому совпадает с третьим полуинвариантом. Для четвёртых и более высоких центрированных моментов это равенство уже не выполняется). Указанное свойство упрощает работу с кумулянтами, так как для них, в отличие от моментов распределения суммы независимых случайных величин, имеющих достаточно громоздкое выражение через моменты самих величин, выражение через полуинварианты слагаемых весьма просто.

Из определения ряда Маклорена полуинвариант порядка определяется как:

.

В частности, для первого полуинварианта имеем:

.

Через моменты

[править | править код]

Выведем теперь альтернативное определение полуинварианта через моменты. Разлагая характеристическую функцию в ряд Маклорена через моменты, можно переписать первую формулу в следующем виде:

.

Разлагая и логарифм в ряд Маклорена и предполагая, что условия на его радиус сходимости выполняются, мы получим:

.

Приравнивая коэффициенты при равных степенях в суммах слева и справа, получаем:

.

Интересный метод, основанный на производной для более простого отыскания этих взаимоотношений, а также эти выражения для более высоких порядков описаны у Кендалла. Он также даёт общую формулу для поиска моментов через полуинварианты и обратно, эта же формула встречается и у Ширяева. Кстати, эту общую формулу в некоторой литературе так и называют формулой Ширяева-Леонтьева, хотя по всей видимости они не были первыми, кто её вывел.

Полуинварианты были введены датским астрономом и математиком Торвальдом Николаем Тиле в 1889 году (по другим данным в 1903 году). В русском языке также используется название семиинварианты (от латинского semi-, что означает полу-, половина). Тиле назвал эти статистические величины полуинвариантами (semi-invariant), и до 1930-х годов их так и называли, пока английский статистик Фишер не предложил название кумулянты (англ. cumulants), ввиду их кумулятивных свойств, и со временем именно это название и закрепилось в литературе. Тем не менее, в русскоязычной литературе предпочтение всегда отдавалось оригинальному названию, например Ширяев использует только лишь оригинальное латинское название. Для обозначения полуинвариант почти всегда используется греческая буква , хотя, например, Ширяев использует .

Несмотря на то, что введены полуинварианты были давно, им уделяли очень мало внимания: только лишь в конце 1930-х годов Фишер впервые провёл систематическое исследование полуинвариантов.

На сегодняшний день полуинварианты прочно вошли в мир современной статистики и её приложений. В частности они очень широко используются в области обработки сигналов, что связано с некоторыми их полезными свойствами: например, все полуинварианты третьего и более высоких порядков равны нулю для нормальных процессов, а смешанные полуинварианты всех порядков статистически независимых величин равны нулю. Используя понятие полуинвариантов, можно ввести более общее понятие статистической независимости двух величин до -го порядка, подразумевая под этим то, что все смешанные полуинварианты порядка до (включительно) равны нулю.

Примечания

[править | править код]
  1. Прохоров Ю. В., Розанов Ю. А. Теория вероятностей (Основные понятия. Предельные теоремы. Случайные процессы) — М.: Главная редакция физико-математической литературы изд-ва «Наука», 1973. - 496 стр.