线性代数
|
![{\displaystyle \mathbf {A} ={\begin{bmatrix}1&2\\3&4\end{bmatrix}}}](https://wikimedia.org/zhwiki/api/rest_v1/media/math/render/svg/a31efc33ac33577d719a3ccd162a9bf21e4847ea)
|
向量 · 向量空间 · 基底 · 行列式 · 矩阵
|
|
|
在线性代数里,正定矩阵(英语:positive-definite matrix)是埃尔米特矩阵的一种,有时会简称为正定阵。在线性代数中,正定矩阵的性质类似复数中的正实数。与正定矩阵相对应的线性算子是对称正定双线性形式(复域中则对应埃尔米特正定双线性形式)。
一个
的实对称矩阵
是正定的,当且仅当对于所有的非零实系数向量
,都有
。其中
表示
的转置。对于复数的情况,定义则为:一个
的埃尔米特矩阵
是正定的当且仅当对于每个非零的复向量
,都有
。其中
表示
的共轭转置。
这样的定义仰赖一个事实:对于任意的埃尔米特矩阵
及复向量
,
必定是实数。
对于
的埃尔米特矩阵
,下列性质与“
为正定矩阵”等价:
的所有的特征值
都是正的。 根据
谱定理,
![{\displaystyle M}](https://wikimedia.org/zhwiki/api/rest_v1/media/math/render/svg/f82cade9898ced02fdd08712e5f0c0151758a0dd)
与一个实
对角矩阵
相似(也就是说
![{\displaystyle M=U^{-1}DU}](https://wikimedia.org/zhwiki/api/rest_v1/media/math/render/svg/6b492cffc6e01da48c730c6f52a21b13d7c3f9cd)
,其中
![{\displaystyle U}](https://wikimedia.org/zhwiki/api/rest_v1/media/math/render/svg/458a728f53b9a0274f059cd695e067c430956025)
是
酉矩阵,或者说
![{\displaystyle M}](https://wikimedia.org/zhwiki/api/rest_v1/media/math/render/svg/f82cade9898ced02fdd08712e5f0c0151758a0dd)
在某个
正交基可以表示为一个实
对角矩阵)。因此,
![{\displaystyle M}](https://wikimedia.org/zhwiki/api/rest_v1/media/math/render/svg/f82cade9898ced02fdd08712e5f0c0151758a0dd)
是正定阵当且仅当相应的
![{\displaystyle D}](https://wikimedia.org/zhwiki/api/rest_v1/media/math/render/svg/f34a0c600395e5d4345287e21fb26efd386990e6)
的对角线上元素都是正的。 另外,也可以假设
![{\displaystyle \lambda _{i}}](https://wikimedia.org/zhwiki/api/rest_v1/media/math/render/svg/72fde940918edf84caf3d406cc7d31949166820f)
和
![{\displaystyle \mathbf {v} _{i}}](https://wikimedia.org/zhwiki/api/rest_v1/media/math/render/svg/51747274b58895dd357bb270ba1b5cb71e4fa355)
是
![{\displaystyle M}](https://wikimedia.org/zhwiki/api/rest_v1/media/math/render/svg/f82cade9898ced02fdd08712e5f0c0151758a0dd)
的一组特征值与特征向量,根据定义
![{\displaystyle M\mathbf {v} _{i}=\lambda _{i}\mathbf {v} _{i}}](https://wikimedia.org/zhwiki/api/rest_v1/media/math/render/svg/73fd74c01d82f7c2ac691a01311ff226b9befc4b)
,从左侧同乘以
得到:
![{\displaystyle \mathbf {v} _{i}^{*}M\mathbf {v} _{i}=\lambda _{i}\mathbf {v} _{i}^{*}\mathbf {v} _{i}=\lambda _{i}\Vert \mathbf {v} _{i}\Vert ^{2}}](https://wikimedia.org/zhwiki/api/rest_v1/media/math/render/svg/88d58c5aa9eaea0dd0ea4fa6504c6efd097b602b)
。因为
![{\displaystyle M}](https://wikimedia.org/zhwiki/api/rest_v1/media/math/render/svg/f82cade9898ced02fdd08712e5f0c0151758a0dd)
是正定矩阵,根据定义我们有
![{\displaystyle \mathbf {v} _{i}^{*}M\mathbf {v} >0}](https://wikimedia.org/zhwiki/api/rest_v1/media/math/render/svg/788f4170e906003e4966a5eb396a8bf802338651)
。移项整理后可以得到
![{\displaystyle \lambda _{i}={\frac {\mathbf {v} ^{*}M\mathbf {v} }{\Vert \mathbf {v} _{i}\Vert ^{2}}}>0}](https://wikimedia.org/zhwiki/api/rest_v1/media/math/render/svg/992615a656d13c54e039ed00d8449b28541c7c07)
。注意因为特征向量
![{\displaystyle \mathbf {v} _{i}\neq \mathbf {0} }](https://wikimedia.org/zhwiki/api/rest_v1/media/math/render/svg/5b234ecef7760dfbb26e85b128ea926e17fa3b3c)
,所以前述
![{\displaystyle \lambda _{i}}](https://wikimedia.org/zhwiki/api/rest_v1/media/math/render/svg/72fde940918edf84caf3d406cc7d31949166820f)
不会有无解的情形。
- 半双线性形式
定义了一个
上的内积。实际上,所有
上的内积都可视为由某个正定矩阵通过此种方式得到。
是向量
构成的格拉姆矩阵,其中
。更精确地说,
定义为:
。换句话说,
具有
的形式,其中
不一定是方阵,但必须是单射的。
的所有顺序主子式,也就是顺序主子阵的行列式都是正的(西尔维斯特准则)。明确地说,就是考察
左上角大小
的子矩阵的行列式。对于半正定矩阵而言,相应的条件应改为所有的主子式非负。但顺序主子式非负并不能推出矩阵是半正定的。比如以下例子: ![{\displaystyle {\begin{bmatrix}1&1&1\\1&1&1\\1&1&0\end{bmatrix}}}](https://wikimedia.org/zhwiki/api/rest_v1/media/math/render/svg/29d2a456ccbe65bb08a2c96069b96d6ae6b6cd9d)
- 存在唯一的下三角矩阵
,其主对角线上的元素全是正的,使得
。其中
是
的共轭转置。这一分解被称为科列斯基分解。
对于实对称矩阵,只需将上述性质中的
改为
,并将“共轭转置”改为“转置”即可。
由以上的第二个等价条件,可以得到二次型形式下正定矩阵的等价条件:用
代表
或
,设
是
上的一个向量空间。一个埃尔米特型:
![{\displaystyle B:V\times V\rightarrow K}](https://wikimedia.org/zhwiki/api/rest_v1/media/math/render/svg/843de2b7c7221cc40fc361ac79d83948e00b00b0)
是一个双线性映射,使得
总是
的共轭。这样的一个映射
是正定的当且仅当对于
中所有的非零向量
,都有
。
与正定矩阵对应,一个
的埃尔米特矩阵
是负定矩阵(英语:negative-definite matrix)当且仅当对所有非零向量
(或
),都有
。
是半正定矩阵(英语:positive semi-definite matrix)当且仅当对于所有非零向量
(或
),都有
。
是半负定矩阵(英语:negative semi-definite matrix)当且仅当对于所有非零向量
(或
),都有
。
如果一个埃尔米特矩阵既不是半正定也不是半负定的,那么称其为不定矩阵(英语:indefinite matrix)。
可以看出,上一节中正定矩阵的第一个等价性质只需作出相应改动,就可以变为判别负定矩阵、半正定矩阵和半负定矩阵的准则。注意当
是半正定时,相应的格拉姆矩阵不必由线性独立的向量组成。对于任意矩阵
,
必是半正定的,并有
(两者的秩相等)。反过来,任意的半正定矩阵都可以写作
,这就是科列斯基分解。
一个埃尔米特矩阵
是负定矩阵当且仅当
的所有奇数阶顺序主子式小于
,所有偶数阶顺序主子式大于
。当
是负定矩阵时,
的逆矩阵也是负定的。
若
为半正定矩阵,可以记作
。如果
是正定矩阵,可以记作
。这个记法来自泛函分析,其中的正定矩阵定义了正算子。
对于一般的埃尔米特矩阵,
、
,
当且仅当
。这样可以定义一个在埃尔米特矩阵集合上的偏序关系。类似地,可以定义
。
1. |
每个正定阵都是可逆的,它的逆也是正定阵。如果 那么 。
|
2. |
如果 是正定阵, 为正实数,那么 也是正定阵。
如果 、 是正定阵,那么 、 与 都是正定的。如果 ,那么 仍是正定阵。
|
3. |
如果 那么主对角线上的元素 为正实数。于是有 。此外还有
。
|
4. |
矩阵 是正定阵当且仅当存在唯一的正定阵 使得 。根据其唯一性可以记作 ,称 为 的平方根。对半正定阵也有类似结论。同时,如果 那么 。
|
5. |
如果 那么 ,其中 表示克罗内克积。
|
6. |
对矩阵 ,将两者同一位置上的系数相乘所得的矩阵记为 ,即 ,称为 与 的 阿达马乘积。如果 ,那么 。如果 为实系数矩阵,则以下不等式成立:
。
|
7. |
设 , 为埃尔米特矩阵。如果 (相应地, ),那么 (相应地, )。
|
8. |
如果 为实系数矩阵,则 。
|
9. |
如果 为实系数矩阵,那么存在 使得 ,其中 为单位矩阵。
|
一个实矩阵
可能满足对于所有的非零实向量
,
,却不是对称矩阵。举例来说,矩阵
就满足这个条件。对于
并且
,
。
一般来说,一个实系数矩阵
满足对所有非零实向量
,
,当且仅当对称矩阵
是正定矩阵。
对于复系数矩阵,情况可能会不太一样。主要考虑如何扩展
这一性质。要使得
总为实数,矩阵
必须是埃尔米特矩阵。因此,若
总是正实数,
必然是正定的埃尔米特矩阵。如果将
扩展为
,则等价于
为正定矩阵。
- Roger A. Horn and Charles R. Johnson. Matrix Analysis, Chapter 7. Cambridge University Press, 1985. ISBN 0-521-30586-1 (hardback), ISBN 0-521-38632-2 (paperback).
- Rajendra Bhatia. Positive definite matrices,. Princeton Series in Applied Mathematics, 2007. ISBN 978-0691129181.