第131行:
第131行:
* ''[http://stat.ethz.ch/~stahel/lognormal/bioscience.pdf Log-normal Distributions across the Sciences: Keys and Clues]'', E. Limpert, W. Stahel and M. Abbt,. BioScience, 51 (5), p. 341–352 (2001).
* ''[http://stat.ethz.ch/~stahel/lognormal/bioscience.pdf Log-normal Distributions across the Sciences: Keys and Clues]'', E. Limpert, W. Stahel and M. Abbt,. BioScience, 51 (5), p. 341–352 (2001).
* ''[http://www.rotman.utoronto.ca/%7Ehull/Technical%20Notes/TechnicalNote2.pdf 对数正态分布特性]'', [[John Hull]], in ''Options, Futures, and Other Derivatives'' 6E (2005). ISBN 0-13-149908-4
* ''[http://www.rotman.utoronto.ca/%7Ehull/Technical%20Notes/TechnicalNote2.pdf 对数正态分布特性]'', [[John Hull]], in ''Options, Futures, and Other Derivatives'' 6E (2005). ISBN 0-13-149908-4
* [[Eric W. Weisstein]] et al. [http://mathworld.wolfram.com/LogNormalDistribution.html 对数正态分布] at [[MathWorld]]. Electronic document, [[2006年]][[10月26日]]造訪.
* [[Eric W. Weisstein]] et al. [http://mathworld.wolfram.com/LogNormalDistribution.html 对数正态分布] at [[MathWorld]]. Electronic document, 2006年10月26日造訪.
== 参见 ==
== 参见 ==
在概率论 与统计学 中,对数正态分布 是对数 为正态分布 的任意随机变量 的概率分布 。如果 X 是正态分布的随机变量,则 exp (X ) 为对数正态分布;同样,如果 Y 是对数正态分布,则 ln(Y ) 为正态分布。
如果一个变量可以看作是许多很小独立因子的乘积 ,则这个变量可以看作是对数正态分布。一个典型的例子是股票投资的长期收益率,它可以看作是每天收益率的乘积。
对于
x
>
0
{\displaystyle x>0}
,对数正态分布的概率密度函数 为
f
(
x
;
μ
,
σ
)
=
1
x
σ
2
π
e
−
(
ln
x
−
μ
)
2
/
2
σ
2
{\displaystyle f(x;\mu ,\sigma )={\frac {1}{x\sigma {\sqrt {2\pi }}}}e^{-(\ln x-\mu )^{2}/2\sigma ^{2}}}
其中
μ
{\displaystyle \mu }
与
σ
{\displaystyle \sigma }
分别是变量对数 的平均值 与標準差 。它的期望值 是
E
(
X
)
=
e
μ
+
σ
2
/
2
{\displaystyle \mathrm {E} (X)=e^{\mu +\sigma ^{2}/2}}
方差 为
v
a
r
(
X
)
=
(
e
σ
2
−
1
)
e
2
μ
+
σ
2
.
{\displaystyle \mathrm {var} (X)=(e^{\sigma ^{2}}-1)e^{2\mu +\sigma ^{2}}.\,}
给定期望值与方差,也可以用这个关系求
μ
{\displaystyle \mu }
与
σ
{\displaystyle \sigma }
μ
=
ln
(
E
(
X
)
)
−
1
2
ln
(
1
+
v
a
r
(
X
)
E
(
X
)
2
)
,
{\displaystyle \mu =\ln(\mathrm {E} (X))-{\frac {1}{2}}\ln \left(1+{\frac {\mathrm {var} (X)}{\mathrm {E} (X)^{2}}}\right),}
σ
2
=
ln
(
1
+
v
a
r
(
X
)
E
(
X
)
2
)
.
{\displaystyle \sigma ^{2}=\ln \left(1+{\frac {\mathrm {var} (X)}{\mathrm {E} (X)^{2}}}\right).}
与几何平均值和几何标准差的关系
对数正态分布、几何平均数 与几何标准差 是相互关联的。在这种情况下,几何平均值等于
exp
(
μ
)
{\displaystyle \exp(\mu )}
,几何平均差等于
exp
(
σ
)
{\displaystyle \exp(\sigma )}
。
如果采样数据来自于对数正态分布,则几何平均值与几何标准差可以用于估计置信区间,就像用算术平均数 与标准差估计正态分布的置信区间一样。
置信区间界
对数空间
几何
3σ 下界
μ
−
3
σ
{\displaystyle \mu -3\sigma }
μ
g
e
o
/
σ
g
e
o
3
{\displaystyle \mu _{\mathrm {geo} }/\sigma _{\mathrm {geo} }^{3}}
2σ 下界
μ
−
2
σ
{\displaystyle \mu -2\sigma }
μ
g
e
o
/
σ
g
e
o
2
{\displaystyle \mu _{\mathrm {geo} }/\sigma _{\mathrm {geo} }^{2}}
1σ 下界
μ
−
σ
{\displaystyle \mu -\sigma }
μ
g
e
o
/
σ
g
e
o
{\displaystyle \mu _{\mathrm {geo} }/\sigma _{\mathrm {geo} }}
1σ 上界
μ
+
σ
{\displaystyle \mu +\sigma }
μ
g
e
o
σ
g
e
o
{\displaystyle \mu _{\mathrm {geo} }\sigma _{\mathrm {geo} }}
2σ 上界
μ
+
2
σ
{\displaystyle \mu +2\sigma }
μ
g
e
o
σ
g
e
o
2
{\displaystyle \mu _{\mathrm {geo} }\sigma _{\mathrm {geo} }^{2}}
3σ 上界
μ
+
3
σ
{\displaystyle \mu +3\sigma }
μ
g
e
o
σ
g
e
o
3
{\displaystyle \mu _{\mathrm {geo} }\sigma _{\mathrm {geo} }^{3}}
其中几何平均数
μ
g
e
o
=
exp
(
μ
)
{\displaystyle \mu _{\mathrm {geo} }=\exp(\mu )}
,几何标准差
σ
g
e
o
=
exp
(
σ
)
{\displaystyle \sigma _{\mathrm {geo} }=\exp(\sigma )}
矩
原始矩 为:
μ
1
=
e
μ
+
σ
2
/
2
{\displaystyle \mu _{1}=e^{\mu +\sigma ^{2}/2}}
μ
2
=
e
2
μ
+
4
σ
2
/
2
{\displaystyle \mu _{2}=e^{2\mu +4\sigma ^{2}/2}}
μ
3
=
e
3
μ
+
9
σ
2
/
2
{\displaystyle \mu _{3}=e^{3\mu +9\sigma ^{2}/2}}
μ
4
=
e
4
μ
+
16
σ
2
/
2
{\displaystyle \mu _{4}=e^{4\mu +16\sigma ^{2}/2}}
或者更为一般的矩
μ
k
=
e
k
μ
+
k
2
σ
2
/
2
.
{\displaystyle \mu _{k}=e^{k\mu +k^{2}\sigma ^{2}/2}.}
局部期望
随机变量
X
{\displaystyle X}
在阈值
k
{\displaystyle k}
上的局部期望定义为
g
(
k
)
=
∫
k
∞
(
x
−
k
)
f
(
x
)
d
x
{\displaystyle g(k)=\int _{k}^{\infty }(x-k)f(x)\,dx}
其中
f
(
x
)
{\displaystyle f(x)}
是概率密度。对于对数正态概率密度,这个定义可以表示为
g
(
k
)
=
exp
(
μ
+
σ
2
/
2
)
Φ
(
−
ln
(
k
)
+
μ
+
σ
2
σ
)
−
k
Φ
(
−
ln
(
k
)
+
μ
σ
)
{\displaystyle g(k)=\exp(\mu +\sigma ^{2}/2)\Phi \left({\frac {-\ln(k)+\mu +\sigma ^{2}}{\sigma }}\right)-k\Phi \left({\frac {-\ln(k)+\mu }{\sigma }}\right)}
其中
Φ
{\displaystyle \Phi }
是标准正态部分的累积分布函数 。对数正态分布的局部期望在保险业 及经济领域都有应用。
参数的最大似然估计
为了确定对数正态分布参数 μ 与 σ 的最大似然估计 ,我们可以采用与正态分布 参数最大似然估计同样的方法。我们来看
f
L
(
x
;
μ
,
σ
)
=
1
x
f
N
(
ln
x
;
μ
,
σ
)
{\displaystyle f_{L}(x;\mu ,\sigma )={\frac {1}{x}}\,f_{N}(\ln x;\mu ,\sigma )}
其中用
f
L
(
⋅
)
{\displaystyle f_{L}(\cdot )}
表示对数正态分布的概率密度函数,用
f
N
(
⋅
)
{\displaystyle f_{N}(\cdot )}
— 表示正态分布。因此,用与正态分布同样的指数,我们可以得到对数最大似然函数:
ℓ
L
(
μ
,
σ
|
x
1
,
x
2
,
.
.
.
,
x
n
)
=
−
∑
k
ln
x
k
+
ℓ
N
(
μ
,
σ
|
ln
x
1
,
ln
x
2
,
…
,
ln
x
n
)
=
=
constant
+
ℓ
N
(
μ
,
σ
|
ln
x
1
,
ln
x
2
,
…
,
ln
x
n
)
.
{\displaystyle {\begin{matrix}\ell _{L}(\mu ,\sigma |x_{1},x_{2},...,x_{n})&=&-\sum _{k}\ln x_{k}+\ell _{N}(\mu ,\sigma |\ln x_{1},\ln x_{2},\dots ,\ln x_{n})=\\\\\ &=&\operatorname {constant} +\ell _{N}(\mu ,\sigma |\ln x_{1},\ln x_{2},\dots ,\ln x_{n}).\end{matrix}}}
由于第一项相对于 μ 与 σ 来说是常数,两个对数最大似然函数
ℓ
L
{\displaystyle \ell _{L}}
与
ℓ
N
{\displaystyle \ell _{N}}
在同样的 μ 与 σ 处有最大值。因此,根据正态分布最大似然参数估计器的公式以及上面的方程,我们可以推导出对数正态分布参数的最大似然估计
μ
^
=
∑
k
ln
x
k
n
,
σ
^
2
=
∑
k
(
ln
x
k
−
μ
^
)
2
n
.
{\displaystyle {\widehat {\mu }}={\frac {\sum _{k}\ln x_{k}}{n}},\ {\widehat {\sigma }}^{2}={\frac {\sum _{k}{\left(\ln x_{k}-{\widehat {\mu }}\right)^{2}}}{n}}.}
相关分布
如果
Y
=
ln
(
X
)
{\displaystyle Y=\ln(X)}
与
X
∼
L
o
g
-
N
(
μ
,
σ
2
)
{\displaystyle X\sim \operatorname {Log-N} (\mu ,\sigma ^{2})}
,则
Y
∼
N
(
μ
,
σ
2
)
{\displaystyle Y\sim N(\mu ,\sigma ^{2})}
是正态分布 。
如果
X
m
∼
L
o
g
-
N
(
μ
,
σ
m
2
)
,
m
=
1...
n
¯
{\displaystyle X_{m}\sim \operatorname {Log-N} (\mu ,\sigma _{m}^{2}),\ m={\overline {1...n}}}
是有同样 μ 参数、而 σ 可能不同的统计独立 对数正态分布变量 ,并且
Y
=
∏
m
=
1
n
X
m
{\displaystyle Y=\prod _{m=1}^{n}X_{m}}
,则 Y 也是对数正态分布变量:
Y
∼
L
o
g
-
N
(
n
μ
,
∑
m
=
1
n
σ
m
2
)
{\displaystyle Y\sim \operatorname {Log-N} \left(n\mu ,\sum _{m=1}^{n}\sigma _{m}^{2}\right)}
。
进一步的阅读资料
参考文献
对数正态分布 , Aitchison, J. and Brown, J.A.C. (1957)
Log-normal Distributions across the Sciences: Keys and Clues , E. Limpert, W. Stahel and M. Abbt,. BioScience, 51 (5), p. 341–352 (2001).
对数正态分布特性 , John Hull , in Options, Futures, and Other Derivatives 6E (2005). ISBN 0-13-149908-4
Eric W. Weisstein et al. 对数正态分布 at MathWorld . Electronic document, 2006年10月26日造訪.
参见