Полуинвариант (теория вероятностей): различия между версиями

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску
[непроверенная версия][непроверенная версия]
Содержимое удалено Содержимое добавлено
Нет описания правки
Коррекция грамматики
 
(не показаны 2 промежуточные версии 2 участников)
Строка 9: Строка 9:
: <math>\ln G(u) \, = \, iu\kappa_1 + \frac{(iu)^2}{2!}\kappa_2 + \ldots +\frac{(iu)^n}{n!} \kappa_n + \ldots = \sum\limits_{n=1}^{\infty}\frac{(iu)^n}{n!} \kappa_n</math>.
: <math>\ln G(u) \, = \, iu\kappa_1 + \frac{(iu)^2}{2!}\kappa_2 + \ldots +\frac{(iu)^n}{n!} \kappa_n + \ldots = \sum\limits_{n=1}^{\infty}\frac{(iu)^n}{n!} \kappa_n</math>.


Единственное отличие состоит в том, что первый член этого ряда полагается равным <math>0
Единственное отличие состоит в том, что первый член этого ряда принимается равным <math>0
</math>, а не <math>1
</math>, а не <math>1
</math> как в случае моментов. Поэтому логарифм характеристической функции является производящей функцией для полуинвариантов, его иногда называют ''второй характеристической функцией'' и обозначают:
</math> как в случае моментов. Поэтому логарифм характеристической функции является производящей функцией для полуинвариантов, его иногда называют ''второй характеристической функцией'' и обозначают:
Строка 19: Строка 19:
: <math>\ln G(a+b) = \ln G(a)+\ln G(b)</math>.
: <math>\ln G(a+b) = \ln G(a)+\ln G(b)</math>.


Это с очевидностью следует из того факта, что характеристическая [[мультипликативная функция]] по независимым случайным величинам (равна произведению соответствующих функций). Это же свойство, как следствие, присуще полуинвариантам: в частности, поскольку первым и вторым полуинвариантом случайной величины служат её [[математическое ожидание]] и [[Дисперсия случайной величины|дисперсия]], то для суммы независимых случайных величин они соответственно равны сумме математических ожиданий или дисперсий самих величин (это верно и для [[Моменты случайной величины|третьего центрального момента]], который поэтому совпадает с третьим полуинвариантом. Для четвёртых и более высоких центрированных моментов это равенство уже не выполняется). Указанное свойство упрощает работу с кумулянтами, так как для них, в отличие от моментов распределения суммы независимых случайных величин, имеющих достаточно громоздкое выражение через моменты самих величин, выражение через полуинварианты слагаемых весьма просто.
Это очевидно следует из того факта, что характеристическая [[мультипликативная функция]] по независимым случайным величинам равна произведению соответствующих функций. Это же свойство, как следствие, присуще полуинвариантам: в частности, поскольку первым и вторым полуинвариантом случайной величины служат её [[математическое ожидание]] и [[Дисперсия случайной величины|дисперсия]], то для суммы независимых случайных величин они соответственно равны сумме математических ожиданий или дисперсий самих величин (это верно и для [[Моменты случайной величины|третьего центрального момента]], который поэтому совпадает с третьим полуинвариантом. Для четвёртых и более высоких центрированных моментов это равенство уже не выполняется). Указанное свойство упрощает работу с кумулянтами, так как для них, в отличие от моментов распределения суммы независимых случайных величин, имеющих достаточно громоздкое выражение через моменты самих величин, выражение через полуинварианты слагаемых весьма просто.
Из определения ряда Маклорена полуинвариант порядка <math>n</math> определяется как:
Из определения ряда Маклорена полуинвариант порядка <math>n</math> определяется как:
Строка 51: Строка 51:
== История ==
== История ==


'''Полуинварианты''' были введены датским астрономом и математиком [[Торвальд Николай Тиле|Торвальдом Николаем Тиле]] в 1889 году (по другим данным в 1903 году). В русском языке также используется название '''семиинварианты''' (от латинского semi-, что означает полу-, половина). Тиле назвал эти статистические величины полуинвариантами (semi-invariant), и до [[1930-е годы|1930-х годов]] их так и называли, пока английский статистик [[Фишер, Рональд Эйлмер|Фишер]] не предложил название '''кумулянты''' ({{lang-en|cumulants}}), ввиду их кумулятивных свойств, и со временем именно это название и закрепилось в литературе. Тем не менее, в русскоязычной литературе предпочтение всегда отдавалось оригинальному названию, например [[Ширяев, Альберт Николаевич|Ширяев]] использует только лишь оригинальное латинское название. Для обозначения полуинвариант почти всегда используется греческая буква <math>\kappa</math>, хотя, например, Ширяев использует <math>\zeta</math>.
'''Полуинварианты''' были введены датским астрономом и математиком [[Торвальд Николай Тиле|Торвальдом Николаем Тиле]] в 1889 году (по другим данным в 1903 году). В русском языке также используется название '''семиинварианты''' (от латинского semi-, что означает полу-, половина). Тиле назвал эти статистические величины полуинвариантами (semi-invariant), и до 1930-х годов их так и называли, пока английский статистик [[Фишер, Рональд Эйлмер|Фишер]] не предложил название '''кумулянты''' ({{lang-en|cumulants}}), ввиду их кумулятивных свойств, и со временем именно это название и закрепилось в литературе. Тем не менее, в русскоязычной литературе предпочтение всегда отдавалось оригинальному названию, например [[Ширяев, Альберт Николаевич|Ширяев]] использует только лишь оригинальное латинское название. Для обозначения полуинвариант почти всегда используется греческая буква <math>\kappa</math>, хотя, например, Ширяев использует <math>\zeta</math>.


Несмотря на то, что введены полуинварианты были давно, им уделяли очень мало внимания: только лишь в конце 1930-х годов [[Фишер Рональд Эймлер|Фишер]] впервые провёл систематическое исследование полуинвариантов.
Несмотря на то, что введены полуинварианты были давно, им уделяли очень мало внимания: только лишь в конце 1930-х годов [[Фишер Рональд Эймлер|Фишер]] впервые провёл систематическое исследование полуинвариантов.

Текущая версия от 23:19, 24 декабря 2024

Полуинварианты, или семиинварианты, или кумулянты — коэффициенты в разложении логарифма характеристической функции случайной величины в ряд Маклорена[1].

Определение

[править | править код]

Через характеристическую функцию

[править | править код]

Полуинварианты, в отличие от моментов, не могут быть определены напрямую через функцию распределения . Их определяют либо через логарифм характеристической функции , либо через моменты (второе определение вытекает из первого). Формально, полуинварианты определяются как коэффициенты в разложении в ряд Маклорена логарифма характеристической функции аналогично тому, как определяются моменты для самой характеристической функции:

.

Единственное отличие состоит в том, что первый член этого ряда принимается равным , а не как в случае моментов. Поэтому логарифм характеристической функции является производящей функцией для полуинвариантов, его иногда называют второй характеристической функцией и обозначают:

.

Интерес к этой функции обусловлен тем, что она аддитивна для независимых случайных величин, то есть для суммы таких величин она равна сумме соответствующих функций для каждой величины:

.

Это очевидно следует из того факта, что характеристическая мультипликативная функция по независимым случайным величинам равна произведению соответствующих функций. Это же свойство, как следствие, присуще полуинвариантам: в частности, поскольку первым и вторым полуинвариантом случайной величины служат её математическое ожидание и дисперсия, то для суммы независимых случайных величин они соответственно равны сумме математических ожиданий или дисперсий самих величин (это верно и для третьего центрального момента, который поэтому совпадает с третьим полуинвариантом. Для четвёртых и более высоких центрированных моментов это равенство уже не выполняется). Указанное свойство упрощает работу с кумулянтами, так как для них, в отличие от моментов распределения суммы независимых случайных величин, имеющих достаточно громоздкое выражение через моменты самих величин, выражение через полуинварианты слагаемых весьма просто.

Из определения ряда Маклорена полуинвариант порядка определяется как:

.

В частности, для первого полуинварианта имеем:

.

Через моменты

[править | править код]

Выведем теперь альтернативное определение полуинварианта через моменты. Разлагая характеристическую функцию в ряд Маклорена через моменты, можно переписать первую формулу в следующем виде:

.

Разлагая и логарифм в ряд Маклорена и предполагая, что условия на его радиус сходимости выполняются, мы получим:

.

Приравнивая коэффициенты при равных степенях в суммах слева и справа, получаем:

.

Интересный метод, основанный на производной для более простого отыскания этих взаимоотношений, а также эти выражения для более высоких порядков описаны у Кендалла. Он также даёт общую формулу для поиска моментов через полуинварианты и обратно, эта же формула встречается и у Ширяева. Кстати, эту общую формулу в некоторой литературе так и называют формулой Ширяева-Леонтьева, хотя по всей видимости они не были первыми, кто её вывел.

Полуинварианты были введены датским астрономом и математиком Торвальдом Николаем Тиле в 1889 году (по другим данным в 1903 году). В русском языке также используется название семиинварианты (от латинского semi-, что означает полу-, половина). Тиле назвал эти статистические величины полуинвариантами (semi-invariant), и до 1930-х годов их так и называли, пока английский статистик Фишер не предложил название кумулянты (англ. cumulants), ввиду их кумулятивных свойств, и со временем именно это название и закрепилось в литературе. Тем не менее, в русскоязычной литературе предпочтение всегда отдавалось оригинальному названию, например Ширяев использует только лишь оригинальное латинское название. Для обозначения полуинвариант почти всегда используется греческая буква , хотя, например, Ширяев использует .

Несмотря на то, что введены полуинварианты были давно, им уделяли очень мало внимания: только лишь в конце 1930-х годов Фишер впервые провёл систематическое исследование полуинвариантов.

На сегодняшний день полуинварианты прочно вошли в мир современной статистики и её приложений. В частности они очень широко используются в области обработки сигналов, что связано с некоторыми их полезными свойствами: например, все полуинварианты третьего и более высоких порядков равны нулю для нормальных процессов, а смешанные полуинварианты всех порядков статистически независимых величин равны нулю. Используя понятие полуинвариантов, можно ввести более общее понятие статистической независимости двух величин до -го порядка, подразумевая под этим то, что все смешанные полуинварианты порядка до (включительно) равны нулю.

Примечания

[править | править код]
  1. Прохоров Ю. В., Розанов Ю. А. Теория вероятностей (Основные понятия. Предельные теоремы. Случайные процессы) — М.: Главная редакция физико-математической литературы изд-ва «Наука», 1973. - 496 стр.