跳转到内容

矩阵:修订间差异

维基百科,自由的百科全书
删除的内容 添加的内容
Snorri留言 | 贡献
无编辑摘要
 
(未显示92个用户的168个中间版本)
第1行: 第1行:
{{NoteTA
{{noteTA|1=zh-hk:綫;zh-tw:線;|2=zh-cn:复;zh-hk:複;zh-tw:複;}}
|G1 = Math
|G2 = Physics
|G3 = IT
|1 = zh-cn:计算机; zh-sg:电脑; zh-tw:電腦;
|2 = zh-cn:域; zh-tw:體;
|3 = zh-hans:领域; zh-hant:領域;
|4 = zh-hans:区域; zh-hant:區域;
|5 = zh-cn:数乘; zh-tw:實數積;
|6=zh-cn:數學對象;zh-tw:數學物件;
}}
{{线性代数}}
{{线性代数}}
{{各地中文名
{{Image|zh-hans=Matrix zh-hans.png|zh-hant=Matrix zh-hant.png|thumb|247px|矩陣}}
|name = ''m''-by-''n'' matrix
|cn = <math>m</math>行<math>n</math>列矩阵
|tw = <math>m</math>列<math>n</math>行矩陣
}}
{{各地中文名
|name = 横排(row)
|cn = 行
|tw = 列
}}
{{各地中文名
|name = 纵排(column)
|cn = 列
|tw = 行
}}

{{Good article}}
{{Good article}}
[[數學]]上,一個{{math|''m''×''n''}}的'''矩陣'''是一个由{{math|''m''}}-{zh-hans:行; zh-hant:列;}-{{math|''n''}}-{zh-hans:列; zh-hant:行;}-元素排列成的[[矩]]阵列。矩陣-{zh-hans:; zh-hant:裏;}-的元素可以是[[數|数字]][[符号]]学式以下是一个由6个数字元素构成的2-{zh-hans:行; zh-hant:列;}-3-{zh-hans:列; zh-hant:行;}-的矩阵:
[[數學]]上,一個<math>m \times n</math>的'''矩陣'''({{lang-en|matrix}})是一个有<math>m</math>-{zh-cn:行; zh-tw:列;}-(row)<math>n</math>-{zh-cn:列; zh-tw:行;}-(column)元素的[[矩]]阵列。矩陣{{里}}的元素可以是[[數|数字]][[符号]]甚至是[[函]]
::<math>\begin{bmatrix}1 & 9 & -13 \\20 & 5 & -6 \end{bmatrix}. </math>


:<math>\begin{bmatrix} a_{1 1} & a_{1 2} & a_{1 3} & \dots & a_{1 j} & \dots & a_{1 n} \\ a_{2 1} & a_{2 2} & a_{2 3} & \dots & a_{2 j} & \dots & a_{2 n} \\ a_{3 1} & a_{3 2} & a_{3 3} & \dots & a_{3 j} & \dots & a_{3 n}\\ \vdots & \vdots & \vdots & \ddots & \vdots & \ddots & \vdots \\ a_{i 1} & a_{i 2} & a_{i 3} & \dots & a_{i j} & \dots & a_{i n}\\ \vdots & \vdots & \vdots & \ddots & \vdots & \ddots & \vdots\\ a_{m 1} & a_{m 2} & a_{m 3} & \dots & a_{m j} & \dots & a_{m n}\end{bmatrix}</math>
大小相同(行数列数都相同)的矩阵之间可以相互加减,具体是对每个位置上的元素做加减法。矩阵的乘法则较为复杂。两个矩阵可以相乘,[[当且仅当]]第一个矩阵的-{zh-hans:列; zh-hant:行;}-数等于第二个矩阵的-{zh-hans:行; zh-hant:列;}-数。矩阵的乘法满足[[结合律]]和[[分配律]],但不满足[[交换律]]。


大小相同(行数列数都相同)的矩阵之间可以相互加减,具体是对每个位置上的元素做加减法。[[矩阵乘法]]则较为复杂。两个矩阵可以相乘,[[当且仅当]]第一个矩阵的-{zh-cn:列; zh-tw:行;}-数等于第二个矩阵的-{zh-cn:行; zh-tw:列;}-数。[[矩阵乘法]]满足[[结合律]]和[[分配律]],但不满足[[交换律]]。
矩阵的一个重要用途是解[[线性方程组]]。线性方程组中未知量的[[系数]]可以排成一个矩阵,加上常数项,则称为增广矩阵。另一个重要用途是表示[[线性变换]],即是诸如{{math|''f''(''x'')}} <math> =</math> 4{{math|''x''}}之类的[[線性函數]]的推广。设定[[基底]]后,某个向量{{math|v}}可以表示为{{math|''m''×}}1的矩阵,而线性变换{{math|''f''可}}以表示为-{zh-hans:行; zh-hant:列;}-数为{{math|''m''}}的矩阵{{math|''A''}},使得经过变换后得到的向量{{math|''f''(v)}}可以表示成{{math|''A''v}}的形式。矩阵的[[特征值]]和[[特征向量]]可以揭示线性变换的深层特性。


矩阵的一个重要用途是解[[线性方程组]]。线性方程组中未知量的[[系数]]可以排成一个矩阵,加上常数项,则称为增广矩阵。另一个重要用途是表示[[线性变换]],即是诸如<math>f(x)=4x</math>之类的[[線性函數]]的推广。设定[[基底]]后,某个向量<math>\mathrm{v}</math>可以表示为<math>m \times 1</math>的矩阵,而线性变换<math>f</math>可以表示为-{zh-cn:列; zh-tw:行;}-数为<math>m</math>的矩阵<math>A</math>,使得经过变换后得到的向量<math>f(\mathrm{v})</math>可以表示成<math>A\mathrm{v}</math>的形式。矩阵的[[特征值]]和[[特征向量]]可以揭示线性变换的深层特性。
矩陣是高等代数学中的常见工具,也常见于[[统计学|统计]]分析等[[应用数学]]学科中。在[[物理学]]中,矩阵于[[电路学]]、[[力学]]、[[光学]]和[[量子力学|量子物理]]中都有应用;[[计算机科学]]中,[[三维动画]]制作也需要用到矩阵。矩阵的运算是[[数值分析]]领域的重要问题。将[[矩阵分解]]为简单矩阵的组合可以在理论和实际应用上简化矩阵的运算。对一些应用广泛而形式特殊的矩阵,例如[[稀疏矩阵]]和[[准对角矩阵]],有特定的快速运算[[算法]]。关于矩阵相关理论的发展和应用,請參考[[矩陣理論]]。在[[天体物理学|天体物理]]、[[量子力学]]等领域,也会出现无穷维的矩阵,是矩阵的一种推广。


矩陣是高等代数学中的常见工具,也常见于[[统计学|统计]]分析等[[应用数学]]学科中。在[[物理学]]中,矩阵在[[力学]]、[[电路学]]、[[光学]]和[[量子力学|量子物理]]等領域中都有应用;[[计算机科学]]中,[[三维动画]]制作也需要用到矩阵。矩阵的运算是[[数值分析]]领域的重要问题。将[[矩阵分解]]为简单矩阵的组合可以在理论和实际应用上简化矩阵的运算。对一些应用广泛而形式特殊的矩阵,例如[[稀疏矩阵]]和[[准对角矩阵]],有特定的快速运算[[算法]]。关于矩阵相关理论的发展和应用,請參考[[矩陣理論]]。在[[天体物理学|天体物理]]、[[量子力学]]等领域,也会出现无穷维的矩阵,是矩阵的一种推广。
==译名==
矩阵的概念最早于1922年见于中文。1922年,[[程廷熙]]在一篇介绍文章中将矩阵译为“纵横阵”。1925年,科学名词审查会算学名词审查组在《科学》第十卷第四期刊登的审定名词表中,矩阵被翻译为“矩阵式”,方块矩阵翻译为“方阵式”,而各类矩阵如“正交矩阵”、“伴随矩阵”中的“矩阵”则被翻译为“方阵”。1935年,中国数学会审查后,中华民国教育部审定的《数学名词》(并“通令全国各院校一律遵用,以昭划一”)中,“矩阵”作为译名首次出现。1938年,曹惠群在接受科学名词审查会委托就数学名词加以校订的《算学名词汇编》中,认为应当的译名是“长方阵”。中华人民共和国成立后编订的《数学名词》中,则将译名定为“(矩)阵”。1993年,[[中国自然科学名词审定委员会]] 公布的《数学名词》中,“矩阵”被定为正式译名,并沿用至今<ref name="hist"/>。


==定义==
==词源==
中文中矩阵的概念最早见于1922年。1922年,[[北京师范大学附属中学]]數學老師[[程廷熙]]在一篇介绍文章中将矩阵译为“纵横阵”。1925年,在科学名词审查会算学名词审查组刊登於《科学》第十卷第四期的审定名词表中,矩阵被翻译为“矩阵式”,方块矩阵翻译为“方阵式”,而各类矩阵如“正交矩阵”、“伴随矩阵”中的“矩阵”则被翻译为“方阵”。1935年,中国数学会审查后,中华民国教育部审定的《数学名词》(并“通令全国各院校一律遵用,以昭划一”)中,“矩阵”作为译名首次出现。1938年,曹惠群在接受科学名词审查会委托就数学名词加以校订的《算学名词汇编》中,认为应当的译名是“长方阵”。1949年中华人民共和国成立后编订的《数学名词》中,则将译名定为“(矩)阵”。1993年,[[中国自然科学名词审定委员会]]公布的《数学名词》中,“矩阵”被定为正式译名,并沿用至今<ref name="hist"/>。
将一些元素排列成若干行,每行放上相同数量的元素,就是一个矩阵。这-{zh-hans:里; zh-hant:裏;}-说的元素可以是数字,例如以下的矩阵:
::<math>\mathbf{A} = \begin{bmatrix}
9 & 13 & 5 \\
1 & 11 & 7 \\
3 & 9 & 2 \\
6 & 0 & 7 \end{bmatrix}</math>
排列成的形状是矩形,所以称为矩阵。在[[中國大陸]],橫向的元素组称為「行」,縱向称為「列」,而在[[台灣]]則相反,橫向称為「列」,縱向称為「行」<ref name="zjh">{{cite book|author=周建華|title=《矩陣》|year=2002|publisher=中央圖書出版社|location=台湾|isbn=9789576374913|language=zh}}</ref> 。矩阵一般用大写[[拉丁字母]]表示,需要具体写出其中元素时,一般用方括号或圆括号括起。以上的矩阵{{math|'''A'''}}是一个4-{zh-hans:行; zh-hant:列;}-3-{zh-hans:列; zh-hant:行;}-的矩阵。


==發展==
行数是1或列数是1的矩阵又可分别称为行向量和列向量。这是因为一个[[向量]]可以表示成行数或列数是1的矩阵形式。矩阵的任一行(列)都是一个行(列)向量,例如矩阵{{math|'''A'''}}的第一-{zh-hans:行; zh-hant:列;}- <math> \begin{bmatrix}
作為解決線性方程的工具,矩陣也有不短的歷史。成书最迟在[[东汉]]前期的《[[九章算术]]》中,已经出现过以矩阵形式表示线性方程组系数以解方程的图例,可視為矩阵的雏形<ref>{{Harvard citations |last1=Shen |last2=Crossley |last3=Lun |year=1999 |nb=yes }}</ref>。矩阵正式作为数学中的研究对象出现,则是在[[行列式]]的研究发展起来后。逻辑上,矩阵的概念先于行列式,但在历史上则恰好相反。日本数学家[[关孝和]](1683年)与微積分的發現者之一[[戈特弗里德·威廉·萊布尼茨]](1693年)近乎同时独立建立了[[行列式|行列式論]]。其后行列式作为解线性方程组的工具逐步发展。1750年,[[加布里尔·克拉默]]发现了[[克莱姆法则]]<ref name="autogenerated2002">{{Harvard citations |last1=克莱因|year=2002 |nb=yes |loc=第33章第4节}}</ref>。
9 & 13 & 5 \end{bmatrix}</math> 就是一个-{zh-hans:行; zh-hant:列;}-向量。行(列)向量可以看成一个向量,因此可以称矩阵的两行(列)相等,或者某一行等于某一列,表示其对应的向量相等。

[[File:Arthur Cayley.jpg|thumb|180px|阿瑟·凯莱被认为是矩阵论的奠基人]]
进入十九世纪后,行列式的研究进一步发展,矩阵的概念也应运而生。[[奧古斯丁·路易·柯西]]是最早将行列式排成方阵并将其元素用双重下标表示的数学家。他还在1829年就在行列式的框架中证明了实对称矩阵特征根为实数的结论<ref>{{Harvard citations |last1=Hawkins |year=1975 |nb=yes }}</ref>。其后,[[詹姆斯·約瑟夫·西爾維斯特]]注意到,在作为行列式的计算形式以外,将数以行和列的形式作出的矩形排列本身也是值得研究的。在他希望引用数的矩形阵列而又不能用行列式来形容的时候,就用“matrix”一词来形容<ref name="autogenerated2002"/>。而在此之前,数学家已经开始将增广矩阵作为独立的对象引用了。西尔维斯特使用“matrix”一词是因为他希望讨论行列式的[[子式]],即将矩阵的某几行和某几列的共同元素取出来排成的矩阵的行列式,所以实际上“matrix”被他看做是生成各种子式的“母-{}-体”:
{{quote|width=70%
|我在先前的文章中将矩形排布的序列称为“Matrix”,盖因从中可以产生出各种不同的行列式,就如由同一个母-{}-体的子宫中孕育出来一样。<ref>The Collected Mathematical Papers of James Joseph Sylvester: 1837–1853, [http://books.google.com/books?id=5GQPlxWrDiEC&pg=PA247&dq=sylvester+matrix+womb&hl=en&ei=uJakTaytCoOv8gPa5cG5Dw&sa=X&oi=book_result&ct=result&resnum=8&ved=0CE8Q6AEwBw#v=onepage&q&f=false Paper 37] {{Wayback|url=http://books.google.com/books?id=5GQPlxWrDiEC&pg=PA247&dq=sylvester+matrix+womb&hl=en&ei=uJakTaytCoOv8gPa5cG5Dw&sa=X&oi=book_result&ct=result&resnum=8&ved=0CE8Q6AEwBw#v=onepage&q&f=false |date=20150321081814 }}, p. 247</ref>}}

[[阿瑟·凯莱]]被公认为矩阵论的奠基人<ref name="autogenerated2002"/>。他开始将矩阵作为独立的[[数学对象]]研究时,许多与矩阵有关的性质已经在行列式的研究中被发现,这也使得凯莱认为矩阵的引进是十分自然的。他说:“我决然不是通过[[四元数]]而获得矩阵概念的;它或是直接从行列式的概念而来,或是作为一个表达线性方程组的方便方法而来的。<ref name="autogenerated2002"/>”他从1858年开始,发表了《矩阵论的研究报告》等一系列关于矩阵的专门论文<ref>{{Harvard citations |last1=Cayley |year=1889 |nb=yes |loc=vol. II, p. 475–496 }}</ref><ref>{{Harvard citations |editor1-last=Dieudonné |year=1978 |loc=Vol. 1, Ch. III, p. 96 |nb=yes }}</ref>,研究了矩阵的运算律、矩阵的逆以及转置和特征多项式方程。凯莱还提出了凯莱-哈密尔顿定理,并验证了3×3矩阵的情况,又说进一步的证明是不必要的。哈密尔顿证明了4×4矩阵的情况,而一般情况下的证明是弗罗贝尼乌斯于1898年给出的<ref name="autogenerated2002"/>。

此后更多数学家开始对矩阵进行研究。埃尔米特证明了如果矩阵等于其复共轭转置,则特征根为实数。这种矩阵后来被称为埃尔米特矩阵<ref name="autogenerated2002"/>。弗罗贝尼乌斯对矩阵的特征方程、特征根、矩阵的秩、正交矩阵、矩阵方程等方面做了大量工作。1878年,在引进了不变因子、初等因子等概念的同时,弗罗贝尼乌斯给出了正交矩阵、[[相似矩阵]]和[[合同矩阵]]的概念。同年,他探讨了矩阵的最小多项式(最小方程)问题。1894年的论文中,他讨论了矩阵理论和四元数理论的关系。1896年,他给出了凯莱-哈密尔顿定理的完整证明<ref name="hist">{{Harvard citations |last1= 董可荣|year=2007 |nb=yes |loc=第3节}}</ref>。矩阵理论在19世纪沿着两个方向发展,分别是作为抽象代数结构和作为代数工具描述几何空间的线性变换。矩阵理论为群论和不变量理论的发展。

无限维矩阵的研究始于1884年。[[庞加莱]]在两篇不严谨地使用了无限维矩阵和行列式理论的文章后开始了对这一方面的专门研究<ref name="hist"/>。1906年,希尔伯特引入无限二次型(相当于无限维矩阵)对积分方程进行研究,极大地促进了无限维矩阵的研究。在此基础上,施密茨、赫林格和特普利茨发展出算子理论,而无限维矩阵成为了研究函数空间算子的有力工具<ref name="hist"/>。

==正式定义==
{{math_theorem
|name=矩陣的定義
|math_statement=
<math>S</math> 是一個集合,那[[函数]] <math>\mathbf{A}:\{1,\,2,\,\ldots,\,m\} \times \{1,\,2,\,\ldots,\,n\} \to S</math> 就會被稱為定義在 <math>S</math> 上的 <math>m \times n</math> '''矩阵'''
}}
直觀上就是用兩個數碼去標記一堆數學實體(如數字、函數),實際上是有限[[序列]]的一種推廣。

<math>\mathbf{A}(i,\,j)</math> 被暱稱為矩陣 <math>\mathbf{A}</math> 裡的'''元素''',通常簡記為<math>\mathbf{A}_{i,j}</math>、<math>\mathbf{A}_{i j}</math>或<math>\mathbf{A}_{[i,j]}</math>。除此之外也會用小寫字母 <math>\mathrm{a}_{i j}</math> 表示元素,來跟矩陣 <math>\mathbf{A}</math> 本身做區別。但不知 <math>\mathbf{A}</math> 的具體形式卻想強調 <math>\mathrm{a}_{i j}</math> 為 <math>\mathbf{A}</math> 的元素的話,可以 <math>\mathbf{A} = [\mathrm{a}_{ij}]_{m \times n}</math> 或 <math>\mathbf{A} = [\mathrm{a}_{i,\,j}]_{m \times n}</math> 表示。

如果表達式 <math>f(i,\,j) = T(i,j)</math>(嚴格來說是[[合式公式]],其中 <math>T</math> 為一個包含變數 <math>T(i,\,j)</math> 的[[一阶逻辑#項|項]])可以唯一決定一個矩陣 <math>\mathbf{A}</math> ,那会将它记成 <math>\mathbf{A} = [T(i,\,j)]_{m \times n}</math> 。如:
:<math>\mathbf{A}:\{1,\,2,\,\ldots,\,m\} \times \{1,\,2,\,\ldots,\,n\} \to \N</math> 且 <math>\mathbf{A}(i,\,j) = i + j</math>

就可以表達為 <math>\mathbf{A} = [i + j]_{m \times n}</math> 。

根據[[公理化集合论]],可以定義一個函數的集合 <math>S^{m \times n}</math> ,它囊括所有定義在 <math>S</math> 上的 <math>m \times n</math> 矩阵,也就是說:
:<math>S^{m\times n} :=
\left\{
f \,|\,
f:\{1,\,2,\,\ldots,\,m\} \times \{1,\,2,\,\ldots,\,n\} \to S
\right\}</math>

=== 行與列 ===
以下的 <math>3 \times 2</math> 矩陣:
::<math>\left\{
\left((1,\,1),\,a \right),\,
\left((1,\,2),\,b \right),\,
\left((2,\,1),\,c \right),\,
\left((2,\,2),\,d \right),\,
\left((3,\,1),\,e \right),\,
\left((3,\,2),\,f \right)
\right\}</math>
一般會如下排列成為矩形來表示:
::<math>\begin{bmatrix}
a & b \\
c & d \\
e & f
\end{bmatrix}</math>
英文將橫向的元素组統称為「'''row'''」,縱向統称為「'''column'''」;但兩岸對此卻以不同的稱呼;在[[中國大陸]],橫向的元素组称為「-{行}-」,縱向称為「-{列}-」,而在[[臺灣]]則相反,橫向称為「-{列}-」,縱向称為「-{行}-」<ref name="zjh">{{cite book|author=周建華|title=《矩陣》|year=2002|publisher=中央圖書出版社|location=台湾|isbn=9789576374913|language=zh}}</ref>。

行数是1或列数是1的矩阵又可分别称为[[行向量與列向量|'''行向量'''和'''列向量''']],在有限[[基 (線性代數)#維度|維]]的情況下,[[向量]]可用其分量表示成行数或列数是1的矩阵。

===範例===
<math>\mathbf{B} = \left[ i+2j \right]_{2 \times 3}</math>是矩阵


===标记===
一个矩阵{{math|'''A'''}}從左上角數起的第{{math|''i''}}-{zh-hans:行; zh-hant:列;}-第{{math|''j''}}-{zh-hans:列; zh-hant:行;}-上的元素称为第{{math|''i'',''j''}}項,通常记为{{math|'''A'''<sub>''i'',''j''</sub>}}、{{math|'''A'''<sub>''ij''</sub>}}、{{math|a<sub>''i'',''j''</sub>}}或{{math|'''A'''<sub>[''i'',''j'']</sub>}}。在上述例子中{{math|'''A'''<sub>[''4'',''3'']</sub>}} <math>=</math> 7。如果不知道矩阵{{math|'''A'''}}的具体元素,通常也会将它记成<math>\scriptstyle \mathbf{A} = \left[ \mathbf{a}_{ij} \right]_{m \times n}</math>或<math>\scriptstyle \mathbf{A} = \left[ \mathbf{a}_{i,j} \right]_{m \times n}</math>。反之,如果{{math|'''A'''}}的元素可以写成只与其行数{{math|''i''}}和列数{{math|''j''}}有关的统一函数{{math|''f''}},那么也可以用<math>\scriptstyle \mathbf{A} = \left[ f(i,j) \right]_{m \times n}</math>作为{{math|'''A'''}}的简写。例如<math>\scriptstyle \mathbf{B} = \left[ i+2j \right]_{2 \times 3}</math>是矩阵
::<math>\mathbf{B} = \begin{bmatrix}
::<math>\mathbf{B} = \begin{bmatrix}
3 & 5 & 7 \\
3 & 5 & 7 \\
4 & 6 & 8 \end{bmatrix}</math>
4 & 6 & 8 \end{bmatrix}</math>
的简写。要注意的是,一些计算机编程语言中,会将第1行(列)称为第0行(列),从而对矩阵的写法产生影响,比如矩阵{{math|'''B'''}}就要改写成<math>\scriptstyle \mathbf{B} = \left[ i+2j+3 \right]_{2 \times 3}</math>。


的简写。要注意的是,计算机编程中,由于数组的首项是第0项,故编程者可能会将第1行/列称为第0行/列,从而对矩阵的写法产生影响,比如矩阵<math>\mathbf{B}</math>就要改写成<math>\mathbf{B} = \left[ i+2j+3 \right]_{2 \times 3}</math>。
矩阵的元素可以是数字、符号或数学表达式。一般为了支持矩阵的运算,矩阵的元素之间应当能做加减法和乘法,所以是某个[[环 (数学)|环]]-{zh-hans:里; zh-hant:裏;}-的元素。最常见的是元素属于[[实数]]域或[[复数]]域的矩阵,简称为实矩阵和复矩阵。更一般的情况下,矩阵的元素可以是由一个[[环 (数学)|环]]中的元素排成。 给定一个[[环 (数学)|环]]{{math|'''R'''}},所有由{{math|'''R'''}}中元素排成的{{math|''m''×''n''}}矩陣的[[集合]]写作<math>\mathcal{M}(m,n,\mathbf{R})</math>或<math>\mathcal{M}_{m \times n}(\mathbf{R})</math>。若{{math|''m''}} <math>=</math> {{math|''n''}},則通常記以 <math>\mathcal{M}(m,\mathbf{R})</math>或<math>\mathcal{M}_m (\mathbf{R})</math>,称其为{{math|''n''}}维矩阵或[[方块矩阵|方阵]]。

矩阵的元素可以是数字、符号或数学表达式。一般为了支援矩阵的运算,矩阵的元素之间应当能做加减法和乘法,所以是某个[[环 (代数)|环]]{{里}}的元素。最常见的是元素属于[[实数]]域或[[复数 (数学)|复数]]域的矩阵,简称为实矩阵和复矩阵。更一般的情况下,矩阵的元素可以是由一个环中的元素排成。给定一个环<math>\mathbf{R}</math>,所有由<math>\mathbf{R}</math>中元素排成的<math>m \times n</math>矩陣的[[集合 (数学)|集合]]写作<math>\mathcal{M}(m,n,\mathbf{R})</math>或<math>\mathcal{M}_{m \times n}(\mathbf{R})</math>。若<math>m=n</math>,則通常記以<math>\mathcal{M}(m,\mathbf{R})</math>或<math>\mathcal{M}_m (\mathbf{R})</math>,称其为<math>n</math>维矩阵或[[方块矩阵|方阵]]。



== 矩陣的基本運算 ==
== 矩陣的基本運算 ==
{{main|矩阵加法|转置矩阵|初等矩阵}}
{{main|矩阵加法|转置矩阵|初等矩阵}}
矩阵的最基本运算包括矩阵加(减)法,-{zh-hans:数乘; zh-hant:純量乘法}-和转置运算。被称为“矩阵加法”、“-{zh-hans:数乘; zh-hant:純量乘法}-”和“转置”的运算不止一种<ref>{{Harvard citations |last1=Brown |year=1991 |nb=yes |loc=Definition I.2.1 (addition), Definition I.2.4 (scalar multiplication), and Definition I.2.33 (transpose) }}</ref>,其中最基本最常用的定义如下:
矩阵的最基本运算包括矩阵加(减)法,数乘和转置运算。被称为“矩阵加法”、“数乘”和“转置”的运算不止一种<ref>{{Harvard citations |last1=Brown |year=1991 |nb=yes |loc=Definition I.2.1 (addition), Definition I.2.4 (scalar multiplication), and Definition I.2.33 (transpose) }}</ref>,其中最基本最常用的定义如下:


{| class="wikitable"
{| class="wikitable"
|-
|-
! style="text-align: center;" scope="col" width="90" | 运算
! scope="col" style="text-align:center; width:90px;"| 运算
! style="text-align: center;" | 定义
! style="text-align: center;" | 定义
! style="text-align: center;" | 例子
! style="text-align: center;" | 例子
|-
|-
| style="text-align: center;" | 加(减)法
| style="text-align: center;" | 加(减)法
| {{math|''m''×''n''}}矩陣{{math|'''A'''}}和{{math|'''B'''}}的和(差):{{math|'''A±B'''}}為一个{{math|''m''×''n''}}矩陣,其中每个元素是{{math|'''A'''}}和{{math|'''B'''}}相应元素的和(差),
|<math>m \times n</math>矩陣<math>\mathbf{A}</math><math>\mathbf{B}</math>的和(差):<math>\mathbf{A}\pm\mathbf{B}</math>為一个<math>m \times n</math>矩陣,其中每个元素是<math>\mathbf{A}</math><math>\mathbf{B}</math>相应元素的和(差),

:{{math|('''A''' ± '''B''')<sub>''i'',''j''</sub>}} <math>=</math> {{math|'''A'''<sub>''i'',''j''</sub> ± '''B'''<sub>''i'',''j''</sub>}},
:<math>(\mathbf{A}\pm\mathbf{B})_{i,j}=\mathbf{A}_{i,j}\pm\mathbf{B}_{i,j}</math>,
:其中 1{{math| ≤ ''i'' ≤ ''m'' ,}} 1{{math| ≤ ''j'' ≤ ''n''.}}
:其中<math>1\leq i \leq m, 1\leq j \leq n</math>
| style="text-align: center;" |
| style="text-align: center;" |
<math>
<math>
第73行: 第147行:
</math>
</math>
|-
|-
| style="text-align: center;" | -{zh-hans:数乘; zh-hant:純量乘法}-
| style="text-align: center;" | 数乘
| 标量{{math|''c''}}与矩陣{{math|'''A'''}}的-{zh-hans:数乘; zh-hant:純量乘法}-{{math|''c'''''A'''}}的每个元素是{{math|'''A'''}}的相应元素与{{math|''c''}}的乘积,
| 标量<math>c</math>与矩陣<math>\mathbf{A}</math>的数乘:<math>c \mathbf{A}</math>的每个元素是<math>\mathbf{A}</math>的相应元素与<math>c</math>的乘积,

:{{math|(''c'''''A''')<sub>''i'',''j''</sub> {{=}} ''c'' · '''A'''<sub>''i'',''j''</sub>.}}
:<math>(c \mathbf{A})_{i,j}=c\cdot\mathbf{A}_{i,j}</math>
| style="text-align: center;" |<math>2 \cdot
| style="text-align: center;" |<math>2 \cdot
\begin{bmatrix}
\begin{bmatrix}
1 & 8 & -3 \\
1 & 8 & -3 \\
第94行: 第169行:
|-
|-
| style="text-align: center;" | 转置
| style="text-align: center;" | 转置
|{{math|''m''×''n''}}矩阵{{math|'''A'''}}的转置是一个{{math|''n''×''m''}}的矩阵,记为{{math|'''A'''<sup>T</sup>}}(有些书中也记为{{math|'''A'''<sup>tr</sup>}}{{math|<sup>t</sup>'''A'''}}、{{math|'''A''''}}),其中的第{{math|''i''}}个-{zh-hans:行; zh-hant:列;}-向量是原矩阵{{math|'''A'''}}的第{{math|''i''}}个-{zh-hans:列; zh-hant:行;}-向量;或者说,转置矩阵{{math|'''A'''<sup>T</sup>}}{{math|''i''}}行第{{math|''j''}}列的元素是原矩阵{{math|'''A'''}}第{{math|''j''}}行第{{math|''i''}}列的元素,
|<math>m \times n</math>矩阵<math>\mathbf{A}</math>的转置是一个<math>n \times m</math>的矩阵,记为<math>\mathbf{A}^\mathrm{T}</math>(有些书中也记为<math>\mathbf{A}^\mathrm{tr}</math>或<math>^\mathrm{t}\mathbf{A}</math>、<math>\mathbf{A}'</math>),其中的第<math>i</math>个-{zh-cn:行; zh-tw:列;}-向量是原矩阵<math>\mathbf{A}</math>的第<math>i</math>个-{zh-cn:列; zh-tw:行;}-向量;或者说,转置矩阵<math>\mathbf{A}^\mathrm{T}</math>第<math>i</math>-{zh-cn:; zh-tw:列;}-<math>j</math>-{zh-cn:; zh-tw:行;}-的元素是原矩阵<math>\mathbf{A}</math><math>j</math>-{zh-cn:; zh-tw:列;}-<math>i</math>-{zh-cn:; zh-tw:行;}-的元素,

:{{math|('''A'''<sup>T</sup>)<sub>''i'',''j''</sub> {{=}} '''A'''<sub>''j'',''i''</sub>.}}
:<math>(\mathbf{A}^\mathrm{T})_{i,j}= \mathbf{A}_{j,i}</math>
| style="text-align: center;" | <math>
| style="text-align: center;" | <math>
\begin{bmatrix}
\begin{bmatrix}
第109行: 第185行:
</math>
</math>
|}
|}
矩阵的加法运算满足交换律:{{math|'''A''' + '''B''' {{=}} '''B''' + '''A'''}}<ref>
矩阵的加法运算满足交换律:<math>\mathbf{A}+\mathbf{B}=\mathbf{B}+\mathbf{A}</math><ref>
{{Harvard citations |last1=Brown |year=1991 |nb=yes |loc=Theorem I.2.6 }}</ref>。矩阵的转置和-{zh-hans:数乘; zh-hant:純量乘法}-运算对加法满足分配律:
{{Harvard citations |last1=Brown |year=1991 |nb=yes |loc=Theorem I.2.6 }}</ref>。矩阵的转置和数乘运算对加法满足分配律:
:<math>(\mathbf{A}+\mathbf{B})^\mathrm{T}=\mathbf{A}^\mathrm{T}+\mathbf{B}^\mathrm{T}</math>
:{{math|('''A''' + '''B''')<sup>T</sup>}} <math>=</math> {{math|'''A'''<sup>T</sup> + '''B'''<sup>T</sup>}}
:<math>c(\mathbf{A}+\mathbf{B})=c\mathbf{A}+c\mathbf{B}</math>
:{{math|''c''('''A''' + '''B''')}} <math>=</math> {{math|''c'''''A''' + ''c'''''B'''}}

矩阵加法和-{zh-hans:数乘; zh-hant:純量乘法}-兩種運算使得<math>\mathcal{M}(m,n,\mathbb{R})</math>成為一个{{math|''mn''}}维的實數[[線性空間]]。而转置和-{zh-hans:数乘; zh-hant:純量乘法}-运算满足类似于结合律的规律:
矩阵加法和数乘兩種運算使得<math>\mathcal{M}(m,n,\mathbb{R})</math>成為一个<math>m n</math>维的實數[[線性空間]]。而转置和数乘运算满足类似于结合律的规律:
:{{math|''c''('''A'''<sup>T</sup>)}} <math>=</math> {{math|(''c'''''A''')<sup>T</sup>.}}
:<math>c(\mathbf{A}^\mathrm{T})=c(\mathbf{A})^\mathrm{T}</math>
矩阵也有类似行列式的[[初等矩阵|初等变换]],即对矩阵的某些行和某些列进行三类操作:交换两行(列),将一行(列)的每个元素都乘以一个固定的量,以及将一行(列)的每个元素乘以一个固定的量之后加到另一行(列)的相应元素上。这些操作在求[[逆矩阵|矩阵的逆]]之时有用。

矩阵也有类似行列式的[[初等矩阵|初等变换]],即对矩阵的某些行和某些列进行三类操作:交换两行/列,将一行/列的每个元素都乘以一个固定的量,以及将一行/列的每个元素乘以一个固定的量之后加到另一行/列的相应元素上。这些操作在求其[[逆矩阵]]时有用。


==矩阵乘法==
==矩阵乘法==
{{main|矩乘法}}
{{main|矩乘法}}
[[Image:Matrix multiplication diagram 2.svg|right|250px|thumb|矩阵{{math|'''A'''}}和{{math|'''B'''}}相乘得到{{math|'''AB'''}}的示意图]]
[[File:Matrix multiplication diagram 2.svg|thumb|239x239px|矩阵{{math|'''A'''}}和{{math|'''B'''}}相乘得到{{math|'''AB'''}}的示意图|替代=]]
两个矩阵的乘法仅当第一个矩陣{{math|'''A'''}}的-{zh-hans:列; zh-hant:行;}-數和另一个矩阵{{math|'''B'''}}的-{zh-hans:行; zh-hant:列;}-數相等时才能定义。如{{math|'''A'''}}是{{math|''m''×''n''}}矩陣和{{math|'''B'''}}是{{math|''n''×''p''}}矩陣,它們的'''乘積'''{{math|'''AB'''}}是一個{{math|''m''×''p''}}矩陣,它的一个元素
两个矩阵的乘法仅当第一个矩陣<math>\mathbf{A}</math>的-{zh-cn:列; zh-tw:行;}-數(column)和另一个矩阵<math>\mathbf{B}</math>的-{zh-cn:行; zh-tw:列;}-數(row)相等时才能定义。如<math>\mathbf{A}</math><math>m \times n</math>矩陣和<math>\mathbf{B}</math><math>n \times p</math>矩陣,它們的'''乘積'''<math>\mathbf{AB}</math>是一個<math>m \times p</math>矩陣,它的一个元素

:<cite id=matrix_product><math> [\mathbf{AB}]_{i,j} = A_{i,1}B_{1,j} + A_{i,2}B_{2,j} + \cdots + A_{i,n}B_{n,j} = \sum_{r=1}^n A_{i,r}B_{r,j}</math></cite>
:<cite id=matrix_product><math> [\mathbf{AB}]_{i,j} = A_{i,1}B_{1,j} + A_{i,2}B_{2,j} + \cdots + A_{i,n}B_{n,j} = \sum_{r=1}^n A_{i,r}B_{r,j}</math></cite>
其中 {{math|1 ≤ ''i'' ≤ ''m'', 1 ≤ ''j'' ≤ ''p'}}'<ref>{{Harvard citations |last1=Brown |year=1991 |nb=yes |loc=Definition I.2.20 }}</ref>。
其中<math>1\leq i\leq m,\ 1\leq j\leq p'</math>'<ref>{{Harvard citations |last1=Brown |year=1991 |nb=yes |loc=Definition I.2.20 }}</ref>。


例如
例如
第148行: 第227行:


矩阵的乘法满足结合律和对矩阵加法的分配律(左分配律和右分配律):
矩阵的乘法满足结合律和对矩阵加法的分配律(左分配律和右分配律):
* 结合律:{{math|('''AB''')'''C'''}} <math>=</math> {{math|'''A'''('''BC'''),}}
* 结合律:<math>(\mathbf{AB})\mathbf{C}=\mathbf{A}(\mathbf{BC})</math>
* 左分配律: {{math|('''A + B''')'''C'''}} <math>=</math> {{math|'''AC''' + '''BC''',}}
* 左分配律:<math>(\mathbf{A}+\mathbf{B})\mathbf{C}=\mathbf{AC}+\mathbf{BC}</math>
* 右分配律: {{math|'''C'''('''A + B''')}} <math>=</math> {{math|'''CA''' + '''CB'''.}}
* 右分配律:<math>\mathbf{C}(\mathbf{A}+\mathbf{B})=\mathbf{CA}+\mathbf{CB}</math>
矩阵的乘法与-{zh-cn:数乘;zh-hk:數乘;zh-tw:純量乘法;}-运算之间也满足类似结合律的规律;与转置之间则满足倒置的分配律。
矩阵的乘法与数乘运算之间也满足类似结合律的规律;与转置之间则满足倒置的分配律。
: {{math|''c''('''AB''')}} <math>=</math> {{math|(''c'''''A''')'''B'''}} <math>=</math> {{math|'''A'''(''c'''''B''')}}
:<math>c(\mathbf{AB})=(c\mathbf{A})\mathbf{B}=\mathbf{A}(c\mathbf{B})</math>
: {{math|('''AB''')<sup>T</sup>}} <math>=</math> {{math|'''B'''<sup>T</sup>'''A'''<sup>T</sup>}}
:<math>(\mathbf{AB})^\mathrm{T}=\mathbf{B}^\mathrm{T}\mathbf{A}^\mathrm{T}</math>
矩阵乘法'''不满足'''[[交换律]]。一般来说,矩陣{{math|'''A'''}}及{{math|'''B'''}}的乘积{{math|'''AB'''}}存在,但{{math|'''BA'''}}不一定存在,即使存在,大多数时候 {{math|'''AB''' ≠ '''BA'''}}。比如下面的例子:

矩阵乘法'''不满足'''[[交换律]]。一般来说,矩陣<math>\mathbf{A}</math>及<math>\mathbf{B}</math>的乘积<math>\mathbf{AB}</math>存在,但<math>\mathbf{BA}</math>不一定存在,即使存在,大多数时候<math>\mathbf{AB}\neq\mathbf{BA}</math>。比如下面的例子:


<center><math>\begin{bmatrix}
<div style="text-align: center;"><math>\begin{bmatrix}
1 & 2\\
1 & 2\\
3 & 4\\
3 & 4\\
第182行: 第263行:
0 & 0\\
0 & 0\\
\end{bmatrix}
\end{bmatrix}
.</math></center>
</math></div>


这一特性使得矩阵代数与常见的一些数域(有理数、实数、复数)以及环([[多项式环]]、整数环)都不同。给定一个{{math|''n''}}维的方块矩阵{{math|'''A'''}},与{{math|'''A'''}}交换的所有方块矩阵构成一个环,称为{{math|'''A'''}}的交换子环。这些矩阵也构成<math>\mathcal{M}(n,\mathbb{R})</math>的一个子空间,称为{{math|'''A'''}}的可交换空间<ref> {{Harvard citations |last1=林志兴 |last2= 杨忠鹏 |year=2010 |loc= |nb=yes }} </ref>。与<math>\mathcal{M}(n,\mathbb{R})</math>中所有矩阵交换的矩阵只有形如 <math>\lambda \mathsf{I}_n , \, \lambda \in \mathbb{R}</math>的矩阵(称为数乘矩阵)。其中的<math> \mathsf{I}_n </math>是[[单位矩阵]],也就是主对角线上的元素为1,其它元素为0的矩阵。任意矩阵{{math|'''M'''}}乘以单位矩阵都得到自身: <math> \mathbf{M} \mathsf{I}_n = \mathbf{M} = \mathsf{I}_n \mathbf{M}</math>。
这一特性使得矩阵代数与常见的一些[[数域]](有理数、实数、复数)以及环([[多项式环]]、整数环)都不同。给定一个<math>n</math>维的方块矩阵<math>\mathbf{A}</math>,与<math>\mathbf{A}</math>交换的所有方块矩阵构成一个环,称为<math>\mathbf{A}</math>的交换子环。这些矩阵也构成<math>\mathcal{M}(n,\mathbb{R})</math>的一个子空间,称为<math>\mathbf{A}</math>的可交换空间<ref> {{Harvard citations |last1=林志兴 |last2= 杨忠鹏|year=2010 |loc= |nb=yes }} </ref>。与<math>\mathcal{M}(n,\mathbb{R})</math>中所有矩阵交换的矩阵只有形如<math>\lambda \mathbf{I}_n , \, \lambda \in \mathbb{R}</math>的矩阵(称为数乘矩阵)。其中的<math> \mathbf{I}_n </math>是[[单位矩阵]],也就是主对角线上的元素为1,其它元素为0的矩阵。任意矩阵<math>\mathbf{M}</math>乘以单位矩阵都得到自身:<math> \mathbf{M} \mathbf{I}_n = \mathbf{M} = \mathbf{I}_n \mathbf{M}</math>。


除了最常见的矩阵乘法定义以外,也有一些较不常见的矩阵乘法,比如[[阿达马乘积]]和[[克罗内克乘积]]<ref>{{Harvard citations |last1=Horn |last2=Johnson |year=1985 |loc=Ch. 4 and 5 |nb=yes }}</ref>。
除了最常见的矩阵乘法定义以外,也有一些较不常见的矩阵乘法,比如[[阿達瑪乘積 (矩陣)|阿达马乘积]]和[[克羅內克乘積|克罗内克乘积]]<ref>{{Harvard citations |last1=Horn |last2=Johnson |year=1985 |loc=Ch. 4 and 5 |nb=yes }}</ref>。


===线性方程组===
===线性方程组===
第197行: 第278行:
其中的<math>a_{1,1}, \, a_{1,2}</math>以及<math>b_{1}, \, b_{2}</math>等等是已知的常数,而<math>x_{1}, \, x_{2}</math>等等则是要求的未知数。运用矩阵的方式,可以将线性方程组写成一个向量方程:
其中的<math>a_{1,1}, \, a_{1,2}</math>以及<math>b_{1}, \, b_{2}</math>等等是已知的常数,而<math>x_{1}, \, x_{2}</math>等等则是要求的未知数。运用矩阵的方式,可以将线性方程组写成一个向量方程:
:<math>\mathbf{A} \mathbf{x} = \mathbf{b}</math>
:<math>\mathbf{A} \mathbf{x} = \mathbf{b}</math>

其中,{{math|'''A'''}}是由方程组-{zh-hans:里; zh-hant:裏;}-未知量的系数排成的{{math|''m''×''n'' }}[[矩陣]],{{math|'''x'''}}是含有{{math|''n'' }}个元素的-{zh-hans:行; zh-hant:列;}-向量,{{math|'''b''' }}是含有{{math|''m'' }}个元素的-{zh-hans:行; zh-hant:列;}-向量<ref>{{Harvard citations |last1=Brown |year=1991 |nb=yes |loc=I.2.21 and 22 }}</ref>。
其中,<math>\mathbf{A}</math>是由方程组里未知量的系数排成的<math>m \times n</math>[[矩陣]],<math>\mathbf{x}</math>是含有<math>n</math>个元素的-{zh-cn:行; zh-tw:列;}-向量,<math>\mathbf{b}</math>是含有<math>m</math>个元素的-{zh-cn:行; zh-tw:列;}-向量<ref>{{Harvard citations |last1=Brown |year=1991 |nb=yes |loc=I.2.21 and 22 }}</ref>。

: <math>
: <math>
\mathbf{A} =
\mathbf{A} =
第221行: 第304行:
\end{bmatrix}
\end{bmatrix}
</math>
</math>
这个写法下,将原来的多个方程转化成一个向量方程,在已知矩阵{{math|'''A'''}}和向量{{math|'''b'''}}的情况下,求未知向量{{math|'''x'''}}。


这个写法下,将原来的多个方程转化成一个向量方程,在已知矩阵<math>\mathbf{A}</math>和向量<math>\mathbf{b}</math>的情况下,求未知向量<math>\mathbf{x}</math>。
=== 綫性變換===

=== 线性变换===
{{main|线性变换}}
{{main|线性变换}}
矩陣是變換的便利表達法。矩陣乘法的本质在联系到變換的时候最能体现,因为矩阵乘法和线性变换的合成有以下的連繫
矩陣是线变换的便利表達法。矩陣乘法的本质在联系到线变换的时候最能体现,因为矩阵乘法和线性变换的合成有以下的联系
以<math> \mathbb{R}^n</math>表示所有長度為''n''的-{zh-hans:行; zh-hant:列;}-向量的集合。每个{{math|''m''×''n''}}的矩{{math|'''A'''}}都代表了一个从<math> \mathbb{R}^n</math>射到<math> \mathbb{R}^m</math>的线性变换。反过来,每個變換<math>f : \mathbb{R}^n \rightarrow \mathbb{R}^m</math>,都存在唯一{{math|''m''×''n''}}矩陣 {{math|'''A'''<sub>''f''</sub>}} 使得所有<math> \mathbb{R}^n</math>中的元素{{math|''x''}} <math>f(x) = A_f x</math> 。这个矩阵{{math|'''A'''<sub>''f''</sub>}} {{math|''i''}} -{zh-hans:行; zh-hant:列;}-第{{math|''j''}} -{zh-hans:列; zh-hant:行;}-上的元素是[[正则基]]向量<math>\mathbf{e}_j = (0, \cdots ,0, 1,0, \cdots 0)^T</math>(第{{math|''j''}} 个元素是1,其余元素是0的向量)在{{math|''f''}}映射后的向量<math>f(\mathbf{e}_j)</math>的第{{math|''i''}} 个元素。
以<math> \mathbb{R}^n</math>表示所有長度為<math>n</math>的-{zh-cn:行; zh-tw:列;}-向量的集合。每个<math>m \times n</math>的矩阵<math>\mathbf{A}</math>都代表了一个从<math> \mathbb{R}^n</math>射到<math> \mathbb{R}^m</math>的线性变换。反过来,每個线变换<math>f : \mathbb{R}^n \rightarrow \mathbb{R}^m</math>,都存在唯一{{math|''m''×''n''}}矩陣<math>\mathbf{A}_f</math>使得所有<math> \mathbb{R}^n</math>中的元素<math>x</math>,<math>f(x) = A_f x</math>。这个矩阵<math>\mathbf{A}_f</math>第<math>i</math>-{zh-cn:行; zh-tw:列;}-第<math>j</math>-{zh-cn:列; zh-tw:行;}-上的元素是[[正则基]]向量<math>\mathbf{e}_j = (0, \cdots ,0, 1,0, \cdots 0)^T</math>(第{{math|''j''}}个元素是1,其余元素是0的向量)在<math>f</math>映射后的向量<math>f(\mathbf{e}_j)</math>的第<math>i</math>个元素。


也就是说,从<math> \mathbb{R}^n</math>射到<math>\mathbb{R}^m</math>的线性变换构成的向量空间 <math>\mathcal{L} \left( \mathbb{R}^n , \mathbb{R}^m \right)</math> 上存在一个到<math>\mathcal{M}(m,n,\mathbb{R})</math>的[[双射|一一映射]]:<math>f \mapsto A_f </math>
也就是说,从<math> \mathbb{R}^n</math>射到<math>\mathbb{R}^m</math>的线性变换构成的向量空间<math>\mathcal{L} \left( \mathbb{R}^n , \mathbb{R}^m \right)</math>上存在一个到<math>\mathcal{M}(m,n,\mathbb{R})</math>的[[双射|一一映射]]:<math>f \mapsto A_f </math>


以下是一些典型的2维实平面上的线性变换对平面向量(图形)造成的效果,以及它们对应的2维矩阵。其中每个线性变换将蓝色图形映射成绿色图形;平面的原点(0, 0)用黑点表示。
以下是一些典型的2维实平面上的线性变换对平面向量(图形)造成的效果,以及它们对应的2维矩阵。其中每个线性变换将蓝色图形映射成绿色图形;平面的原点(0, 0)用黑点表示。
{| class="wikitable" style="text-align:center; margin:1em auto 1em auto;"
{| class="wikitable" style="text-align:center; margin:1em auto 1em auto;"
|-
|-
| [[错切|水平错切变换]], </br>幅度m=1.25.
| [[错切|推移]],<br>幅度m=1.25.
| 水平[[反射]]变换
| 水平[[镜面射 (数学)|鏡射]]变换
| “[[挤压]]”变换,</br>压缩程度r=3/2
| “[[挤压]]”变换,<br>压缩程度r=3/2
|[[相似|放缩变换]],3/2倍
|[[相似|伸縮]],3/2倍
|<cite id=rotation_matrix>[[旋]]变换,左转30°</cite>
|<cite id=rotation_matrix>[[旋]],左转30°</cite>
|-
|-
| <math>\begin{bmatrix}
| <math>\begin{bmatrix}
第246行: 第330行:
0 & 1 \end{bmatrix}</math>
0 & 1 \end{bmatrix}</math>
| <math>\begin{bmatrix}
| <math>\begin{bmatrix}
3/2 & 0 \\
\frac{3}{2} & 0 \\
0 & 2/3 \end{bmatrix}</math>
0 &\frac{2}{3} \end{bmatrix}</math>
|<math>\begin{bmatrix}
|<math>\begin{bmatrix}
3/2 & 0 \\
\frac{3}{2} & 0 \\
0 & 3/2 \end{bmatrix}</math>
0 & \frac{3}{2} \end{bmatrix}</math>
|<math>\begin{bmatrix}\cos(\pi / 6) & -\sin(\pi / 6)\\ \sin(\pi / 6) & \cos(\pi / 6)\end{bmatrix}</math>
|<math>\begin{bmatrix}\cos(\frac{\pi}{6}) & -\sin(\frac{\pi}{6})\\ \sin(\frac{\pi}{6}) & \cos(\frac{\pi}{6})\end{bmatrix}</math>
|-
|-
|width=20%| [[Image:VerticalShear m=1.25.svg|175px]]
|width=20%| [[File:VerticalShear m=1.25.svg|175px]]
|width=20%| [[Image:Flip map.svg|150px]]
|width=20%| [[File:Flip map.svg|150px]]
|width=20%| [[Image:Squeeze r=1.5.svg|150px]]
|width=20%| [[File:Squeeze r=1.5.svg|150px]]
|width=20%| [[Image:Scaling by 1.5.svg|125px]]
|width=20%| [[File:Scaling by 1.5.svg|125px]]
|width=20%| [[Image:Rotation by pi over 6.svg|125px]]
|width=20%| [[File:Rotation by pi over 6.svg|125px]]
|}
|}


设有{{math|''k''×''m''}}的矩陣{{math|'''B'''}}代表性變換{{math|''g'' : '''R'''<sup>''m''</sup>}} <tt>-></tt> {{math|'''R'''<sup>''k''</sup>}},則矩陣積{{math|'''BA'''}}代表了綫性變換的复合{{math|''g'' o ''f''}}<ref>{{Harvard citations |last1=Greub |year=1975 |nb=yes |loc=Section III.2 }}</ref>,因为
设有<math>k \times m</math>的矩陣<math>\mathbf{B}</math>代表线性變換<math>g:\mathbf{R}^m\rightarrow\mathbf{R}^k</math>,則矩陣積<math>\mathbf{BA}</math>代表了綫性變換的复合<math>g\circ f</math><ref>{{Harvard citations |last1=Greub |year=1975 |nb=yes |loc=Section III.2 }}</ref>,因为
:(''g'' ∘ ''f'')('''x''') = ''g''(''f''('''x''')) = ''g''('''Ax''') = '''B'''('''Ax''') = ('''BA''')'''x'''
:<math>(g\circ f)(x)=g(f(x))=g(\mathbf{Ax})=\mathbf{B}(\mathbf{Ax})=(\mathbf{BA})\mathbf{x}</math>


[[矩阵的秩]]是指矩阵中[[线性相关性|线性无关]]的行向量的最大个数<ref>{{Harvard citations |last1=Brown |year=1991 |nb=yes |loc=Definition II.3.3 }}</ref>,同时也是矩阵对应的线性变换的[[像|像空间]]的维度<ref>{{Harvard citations |last1=Greub |year=1975 |nb=yes |loc=Section III.1 }}</ref>。[[秩-零化度定理]]说明矩阵的列数量等于矩阵的秩与[[零空间]]维度之和<ref>{{Harvard citations |last1=Brown |year=1991 |nb=yes |loc=Theorem II.3.22 }}</ref>。
[[矩阵的秩]]是指矩阵中[[线性相关性|线性无关]]的行列向量的最大个数<ref>{{Harvard citations |last1=Brown |year=1991 |nb=yes |loc=Definition II.3.3 }}</ref>,同时也是矩阵对应的线性变换的[[像 (數學)|像空间]]的维度<ref>{{Harvard citations |last1=Greub |year=1975 |nb=yes |loc=Section III.1 }}</ref>。[[秩-零化度定理]]说明矩阵的-{zh-cn:; zh-tw:行;}-数量等于矩阵的秩与[[零空间]]维度之和<ref>{{Harvard citations |last1=Brown |year=1991 |nb=yes |loc=Theorem II.3.22 }}</ref>。


==方块矩阵==<!-- This section is linked from [[Orthogonal matrix]] -->
==方块矩阵==


{{main|方块矩阵}}
{{main|方块矩阵}}
行数与列数相同的矩阵称为'''方块矩阵''',简称方阵。所有{{math|''n''}}维的方块矩阵构成一个线性空间,这个空间对矩阵乘法也是封闭的,因此也是一个代数。方阵{{math|'''A'''}}称为[[逆矩阵|可逆]]或非奇异的,如果存在另一个方阵{{math|'''B'''}},使得
行数与列数相同的矩阵称为'''方块矩阵''',简称'''方阵'''。所有<math>n</math>维的方块矩阵构成一个线性空间,这个空间对矩阵乘法也是封闭的,因此也是一个代数。方阵<math>\mathbf{A}</math>称为[[逆矩阵|可逆]]或非奇异的,如果存在另一个方阵<math>\mathbf{B}</math>,使得
:<math>\mathbf{AB}=\mathbf{I}_n</math>
: {{math|'''AB'''}} <math>=</math> {{math|'''I'''<sub>''n''</sub> }}
成立。这时候可以证明也有{{math|'''BA'''}} <math>=</math> {{math|'''I'''<sub>''n''</sub>}}成立<ref>{{Harvard citations |last1=Brown |year=1991 |nb=yes |loc=Definition I.5.13 }}</ref>,可将矩阵{{math|'''B'''}}称为{{math|'''A'''}}的逆矩阵<ref>{{Harvard citations |last1=Brown |year=1991 |nb=yes |loc=Definition I.2.28 }}</ref>。一个矩阵{{math|'''A'''}}的逆矩阵如果存在的话,就是唯一的,通常记作{{math|'''A'''<sup>−1</sup>}}。


成立。这时候可以证明也有<math>\mathbf{BA}=\mathbf{I}_n</math>成立<ref>{{Harvard citations |last1=Brown |year=1991 |nb=yes |loc=Definition I.5.13 }}</ref>,可将矩阵<math>\mathbf{B}</math>称为<math>\mathbf{A}</math>的逆矩阵<ref>{{Harvard citations |last1=Brown |year=1991 |nb=yes |loc=Definition I.2.28 }}</ref>。一个矩阵<math>\mathbf{A}</math>的逆矩阵如果存在的话,就是唯一的,通常记作<math>\mathbf{A}^{-1}</math>。
矩阵{{math|'''A'''}}的元素{{math|A<sub>''i'',''i''</sub>}}称为其主对角线上的元素。方块矩阵{{math|'''A'''}}的所有主对角线元素之和称为它的[[迹]],写作{{math|tr('''A''')}}。尽管矩阵的乘法不满足交换律,方阵相乘时交换顺序会导致乘积变化,但它们的迹不会变,即{{math|tr('''AB''')}} <math>=</math> {{math|tr('''BA''')}}<ref>这个结论容易从矩阵乘法的定义获得:
:<math>\scriptstyle\operatorname{tr}(\mathsf{AB}) = \sum_{i=1}^m \sum_{j=1}^n A_{ij} B_{ji} = \operatorname{tr}(\mathsf{BA}).</math></ref>。除此以外,矩阵转置的迹等于其自身的迹,{{math|tr('''A''')}} <math>=</math> {{math|tr('''A'''<sup>T</sup>)}}。


矩阵<math>\mathbf{A}</math>的元素<math>A_{i,i}</math>称为其主对角线上的元素。方块矩阵<math>\mathbf{A}</math>的所有主对角线元素之和称为它的[[迹]],写作<math>\mathrm{tr}(\mathbf{A})</math>。尽管矩阵的乘法不满足交换律,方阵相乘时交换顺序会导致乘积变化,但它们的迹不会变,即<math>\mathrm{tr}(\mathbf{AB})=\mathrm{tr}(\mathbf{BA})</math><ref>这个结论容易从矩阵乘法的定义获得:
如果一个方阵只有主对角线上的元素不是0,其它都是0,那么称其为[[对角矩阵]]。如果主对角线上方的元素都是0,那么称为下[[三角矩阵]];反之如果主对角线下方的元素都是0,那么称为上三角矩阵。例如{{math|''n''}} <math>=</math> 3的时候,这些矩阵分别写作:
:<math>\scriptstyle\operatorname{tr}(\mathsf{AB}) = \sum_{i=1}^m \sum_{j=1}^n A_{ij} B_{ji} = \operatorname{tr}(\mathsf{BA})</math>。</ref>。除此以外,矩阵转置的迹等于其自身的迹,<math>\mathrm{tr}(\mathbf{A})=\mathrm{tr}(\mathbf{A}^\mathrm{T})</math>。

如果一个方阵只有主对角线上的元素不是0,其它都是0,那么称其为[[对角矩阵]]。如果主对角线上方的元素都是0,那么称为下[[三角矩阵]];反之如果主对角线下方的元素都是0,那么称为上三角矩阵。例如<math>n=3</math>的时候,这些矩阵分别写作:


::<math>
::<math>
第283行: 第368行:
0 & 0 & d_{33} \\
0 & 0 & d_{33} \\
\end{bmatrix}
\end{bmatrix}
</math> (对角矩阵), <math>
</math>(对角矩阵),<math>
\begin{bmatrix}
\begin{bmatrix}
l_{11} & 0 & 0 \\
l_{11} & 0 & 0 \\
第289行: 第374行:
l_{31} & l_{32} & l_{33} \\
l_{31} & l_{32} & l_{33} \\
\end{bmatrix}
\end{bmatrix}
</math> (下三角矩阵)和 <math>
</math>(下三角矩阵)和<math>
\begin{bmatrix}
\begin{bmatrix}
u_{11} & u_{12} & u_{13} \\
u_{11} & u_{12} & u_{13} \\
0 & u_{22} & u_{23} \\
0 & u_{22} & u_{23} \\
0 & 0 & u_{33} \\
0 & 0 & u_{33} \\
\end{bmatrix}</math> (上三角矩阵)。
\end{bmatrix}</math>(上三角矩阵)。


===行列式===
===行列式===
{{main|行列式}}
{{main|行列式}}
[[Image:Determinant Example.png|thumb|300px|right|{{math|'''R'''<sup>2</sup>}}-{zh-hans:; zh-hant:裏;}-的一个线性变换f将蓝色图形变成绿色图形,面积不变,而顺时针排布的向量{{math|''x''}}1和{{math|''x''}}2的变成了逆时针排布。对应的矩阵行列式是-1.]]
[[File:Determinant Example.png|thumb|300px|{{math|'''R'''<sup>2</sup>}}{{里}}的一个线性变换f将蓝色图形变成绿色图形,面积不变,而顺时针排布的向量{{math|''x''}}1和{{math|''x''}}2的变成了逆时针排布。对应的矩阵行列式是-1.]]
方块矩阵{{math|'''A'''}}的行列式是一个将其映射到标量的函数,记作{{math|det('''A''')}}或{{math||'''A'''|}},反映了矩阵自身的一定特性。一个方阵的行列式等于0当且仅当该方阵不可逆。系数是实数的时候,二维(三维)方阵{{math|'''A'''}}的行列式的[[绝对值]]表示单位面积(体积)的图形经过{{math|'''A'''}}对应的线性变换后得到的图形的面积(体积),而它的正负则代表了对应的线性变换是否改变空间的定向:行列式为正说明它保持空间定向,行列式为负则说明它逆转空间定向。
方块矩阵<math>\mathbf{A}</math>的行列式是一个将其映射到标量的函数,记作<math>\det(\mathbf{A})</math><math>\mathbf{|A|}</math>,反映了矩阵自身的一定特性。一个方阵的行列式等于0当且仅当该方阵不可逆。系数是实数的时候,二维(三维)方阵<math>\mathbf{A}</math>的行列式的[[绝对值]]表示单位面积(体积)的图形经过<math>\mathbf{A}</math>对应的线性变换后得到的图形的面积(体积),而它的正负则代表了对应的线性变换是否改变空间的定向:行列式为正说明它保持空间定向,行列式为负则说明它逆转空间定向。


2×2矩阵的行列式是
2×2矩阵的行列式是
:<math>\det \begin{pmatrix}a&b\\c&d\end{pmatrix} = ad-bc.</math>
:<math>\begin{vmatrix}a&b\\c&d\end{vmatrix} = ad-bc</math>
3×3矩阵的行列式由6项组成。更高维矩阵的行列式则可以使用[[莱布尼兹公式]]写出<ref>{{Harvard citations |last1=Brown |year=1991 |nb=yes |loc=Definition III.2.1 }}</ref>,或使用[[拉普拉斯展开]]由低一维的矩阵行列式[[迭代|递推]]得出<ref>{{Harvard citations |last1=Mirsky |year=1990 |nb=yes |loc=Theorem 1.4.1 }}</ref>。
3×3矩阵的行列式由6项组成。更高维矩阵的行列式则可以使用莱布尼兹公式写出<ref>{{Harvard citations |last1=Brown |year=1991 |nb=yes |loc=Definition III.2.1 }}</ref>,或使用[[拉普拉斯展开]]由低一维的矩阵行列式[[迭代|递推]]得出<ref>{{Harvard citations |last1=Mirsky |year=1990 |nb=yes |loc=Theorem 1.4.1 }}</ref>。


两个矩阵相乘,乘积的行列式等于它们的行列式的乘积:{{math|det('''AB''')}} <math>=</math> {{math|det('''A''')·det('''B''')}}<ref>{{Harvard citations |last1=Brown |year=1991 |nb=yes |loc=Theorem III.2.12 }}</ref>。将矩阵的一行乘以某个系数加到另一行上不改变矩阵的行列式,将矩阵的两行互换则使得其行列式变号<ref>{{Harvard citations |last1=Brown |year=1991 |nb=yes |loc=Corollary III.2.16 }}</ref>。用这两种操作可以将矩阵变成一个上三角矩阵或下三角矩阵,而后两种矩阵的行列式就是主对角线上元素的乘积,因此能方便地计算。运用行列式可以计算线性方程组的解(见[[克萊姆法則]])<ref>{{Harvard citations |last1=Brown |year=1991 |nb=yes |loc=Theorem III.3.18 }}</ref>。
两个矩阵相乘,乘积的行列式等于它们的行列式的乘积:<math>\det (\mathbf{AB})=\det(\mathbf{A})\cdot\det(\mathbf{B})</math><ref>{{Harvard citations |last1=Brown |year=1991 |nb=yes |loc=Theorem III.2.12 }}</ref>。将矩阵的一行列乘以某个系数加到另一行列上不改变矩阵的行列式,将矩阵的两行列互换则使得其行列式变号<ref>{{Harvard citations |last1=Brown |year=1991 |nb=yes |loc=Corollary III.2.16 }}</ref>。用这两种操作可以将矩阵变成一个上三角矩阵或下三角矩阵,而后两种矩阵的行列式就是主对角线上元素的乘积,因此能方便地计算。运用行列式可以计算线性方程组的解(见[[克萊姆法則]])<ref>{{Harvard citations |last1=Brown |year=1991 |nb=yes |loc=Theorem III.3.18 }}</ref>。


===特征值与特征向量===
===特征值与特征向量===
{{Main|特征向量}}
{{Main|特征向量}}
{{math|''n''×''n''}}的方块矩阵{{math|'''A'''}}的一个特征值和对应特征向量是满足
<math>n \times n</math>的方块矩阵<math>\mathbf{A}</math>的一个特征值和对应特征向量是满足

:<math>\mathbf{Av} = \lambda \mathbf{v}</math><ref>{{Harvard citations |last1=Brown |year=1991 |nb=yes |loc=Definition III.4.1 }}</ref>
的标量<math>\lambda</math>以及非零向量<math>\mathbf{v}</math>。特征值和特征向量的概念对研究线性变换很有帮助。一个线性变换可以通过它对应的矩阵在[[向量]]上的作用来可视化。一般来说,一个向量在经过映射之后可以变为任何可能的向量,而特征向量具有更好的性质<ref> {{Harvard citations |last1= Steven A. Leduc |nb=yes |loc= 第293页 }}</ref>。假设在给定的基底下,一个线性变换对应着某个矩阵{{math|'''A'''}},如果一个向量{{math|'''x'''}}可以写成矩阵的几个特征向量的线性组合:
:<math>\mathbf{Av}=\lambda\mathbf{v}</math><ref>{{Harvard citations |last1=Brown |year=1991 |nb=yes |loc=Definition III.4.1 }}</ref>的标量<math>\lambda</math>以及非零向量<math>\mathbf{v}</math>。特征值和特征向量的概念对研究线性变换很有帮助。一个线性变换可以通过它对应的矩阵在[[向量]]上的作用来可视化。一般来说,一个向量在经过映射之后可以变为任何可能的向量,而特征向量具有更好的性质<ref> {{Harvard citations |last1= Steven A. Leduc |nb=yes |loc= 第293页}}</ref>。假设在给定的基底下,一个线性变换对应着某个矩阵<math>\mathbf{A}</math>,如果一个向量<math>\mathbf{x}</math>可以写成矩阵的几个特征向量的线性组合:
: <math>\mathbf{x} = c_1 \mathbf{x}_{\lambda_1} + c_2 \mathbf{x}_{\lambda_2} + \cdots + c_k \mathbf{x}_{\lambda_k}</math>
: <math>\mathbf{x} = c_1 \mathbf{x}_{\lambda_1} + c_2 \mathbf{x}_{\lambda_2} + \cdots + c_k \mathbf{x}_{\lambda_k}</math>


其中的<math> \mathbf{x}_{\lambda_i} </math>表示此向量对应的特征值是<math>\lambda_i</math>,那么向量{{math|'''x'''}}经过线性变换后会变成:
其中的<math> \mathbf{x}_{\lambda_i} </math>表示此向量对应的特征值是<math>\lambda_i</math>,那么向量<math>\mathbf{x}</math>经过线性变换后会变成:

: <math>\mathbf{Ax} = c_1 \lambda_1 \mathbf{x}_{\lambda_1} + c_2 \lambda_2 \mathbf{x}_{\lambda_2} + \cdots + c_k \lambda_k \mathbf{x}_{\lambda_k}</math>
: <math>\mathbf{Ax} = c_1 \lambda_1 \mathbf{x}_{\lambda_1} + c_2 \lambda_2 \mathbf{x}_{\lambda_2} + \cdots + c_k \lambda_k \mathbf{x}_{\lambda_k}</math>
可以清楚地知道变换后向量的结构。
可以清楚地知道变换后向量的结构。


另一个等价的特征值定义是:标量<math>\lambda</math>为特征值,如果矩阵<math>\mathbf{A} - \lambda \mathsf{I}_n</math>是不可逆矩阵。根据不可逆矩阵的性质,这个定义也可以用行列式方程描述:<math>\lambda</math>为特征值,如果
另一个等价的特征值定义是:标量<math>\lambda</math>为特征值,如果矩阵<math>\mathbf{A} - \lambda \mathbf{I}_n</math>是不可逆矩阵。根据不可逆矩阵的性质,这个定义也可以用行列式方程描述:<math>\lambda</math>为特征值,如果
:<math>\det(\lambda \mathbf{I}_n - \mathbf{A}) = 0.\ </math><ref>{{Harvard citations |last1=Brown |year=1991 |nb=yes |loc=Definition III.4.9 }}</ref>这个定义中的行列式可以展开成一个关于<math>\lambda</math>的''n''阶[[多项式]],叫做矩阵{{math|'''A'''}}的[[特征多项式]],记为<math>p_{\mathbf{A}}</math>。特征多项式是一个首一多项式(最高次项系数是1的多项式)。它的根就是矩阵<math>\mathbf{A}</math>特征值<ref>{{Harvard citations |last1=Brown |year=1991 |nb=yes |loc=Corollary III.4.10 }}</ref>。[[凱萊-哈密頓定理|哈密尔顿-凯莱定理]]说明,如果用矩阵<math>\mathbf{A}</math>本身代替多项式中的不定元<math>\lambda</math>,那么多项式的值是[[零矩阵]]<ref>{{Harvard citations |last1=王萼芳|year=1997 |nb=yes|loc=4.2,定理3,第247页}}</ref>:
:<math>\det(\lambda \mathsf{I}_n - \mathbf{A}) = 0.\ </math><ref>{{Harvard citations |last1=Brown |year=1991 |nb=yes |loc=Definition III.4.9 }}</ref>
<div style="text-align: center;"><math>p_{\mathbf{A}}(\mathbf{A}) = 0</math>。</div>
这个定义中的行列式可以展开成一个关于<math>\lambda</math>的''n''阶[[多项式]],叫做矩阵{{math|'''A'''}}的[[特征多项式]],记为<math>p_{\mathbf{A}}</math>。特征多项式是一个首一多项式(最高次项系数是1的多项式)。它的根就是矩阵{{math|'''A'''}}特征值<ref>{{Harvard citations |last1=Brown |year=1991 |nb=yes |loc=Corollary III.4.10 }}</ref>。[[凱萊-哈密頓定理|哈密尔顿-凯莱定理]]说明,如果用矩阵{{math|'''A'''}}本身代替多项式中的不定元<math>\lambda</math>,那么多项式的值是零矩阵<ref>{{Harvard citations |last1=王萼芳|year=1997 |nb=yes|loc=4.2,定理3,第247页}}</ref>:
<center><math>p_{\mathbf{A}}(\mathbf{A}) = 0.</math></center>


===对称===
===对称===
{{main|对称矩阵}}
{{main|对称矩阵}}
转置等于自己的矩阵,即满足{{math|'''A'''}} <math>=</math> {{math|'''A'''<sup>T</sup>}}的方块矩阵{{math|'''A'''}}叫做[[对称矩阵]]。满足{{math|'''A'''}} <math>=</math> {{math|- '''A'''<sup>T</sup>}}的矩阵称为[[反对称矩阵]]。在复系数矩阵中,则有[[埃尔米特矩阵]]的概念:满足{{math|'''A'''}} <math>=</math> {{math|'''A'''<sup>*</sup>}}的方块矩阵称为埃尔米特矩阵,其中的{{math|'''A'''<sup>*</sup>}}表示{{math|'''A'''}}的[[共轭转置]]矩阵。
转置等于自己的矩阵,即满足<math>\mathbf{A}=\mathbf{A}^\mathrm{T}</math>的方块矩阵<math>\mathbf{A}</math>叫做[[对称矩阵]]。满足<math>\mathbf{A}=-\mathbf{A}^\mathrm{T}</math>的矩阵称为[[反对称矩阵]]。在复系数矩阵中,则有[[埃尔米特矩阵]]的概念:满足<math>\mathbf{A}=\mathbf{A}^*</math>的方块矩阵称为埃尔米特矩阵,其中的<math>\mathbf{A}^*</math>表示<math>\mathbf{A}</math>的[[共轭转置]]矩阵。


根据[[谱定理]],实对称矩阵和复埃尔米特矩阵拥有特征基,即由矩阵的特征向量组成的基底。因此任何向量都能表示成矩阵特征向量的线性组合。此外,这两类矩阵的特征值都是实数<ref>{{Harvard citations |last1=Horn |last2=Johnson |year=1985 |nb=yes |loc=Theorem 2.5.6 }}</ref>。
根据[[谱定理]],实对称矩阵和复埃尔米特矩阵拥有特征基,即由矩阵的特征向量组成的基底。因此任何向量都能表示成矩阵特征向量的线性组合。此外,这两类矩阵的特征值都是实数<ref>{{Harvard citations |last1=Horn |last2=Johnson |year=1985 |nb=yes |loc=Theorem 2.5.6 }}</ref>。
第334行: 第419行:
|矩阵表达式
|矩阵表达式
| <math>\begin{bmatrix}
| <math>\begin{bmatrix}
1/4 & 0\\
\frac{1}{4} & 0\\
0 & -1/4\end{bmatrix}</math> || <math>\begin{bmatrix}
0 & -\frac{1}{4}\end{bmatrix}</math> || <math>\begin{bmatrix}
1/4 & 0\\
\frac{1}{4} & 0\\
0 & 1/4\end{bmatrix}</math>
0 & \frac{1}{4}\end{bmatrix}</math>
|-
|-
|正定性
|正定性
| 不定矩阵 || 正定矩阵
| 不定矩阵|| 正定矩阵
|-
|-
|对应二次型
|对应二次型
第352行: 第437行:
|}
|}
{{main|正定矩阵}}
{{main|正定矩阵}}
{{math|''n''×''n''}}的实对称矩阵{{math|'''A'''}}如果满足对所有非零向量{{math|'''x'''&nbsp;∈&nbsp;'''R'''<sup>''n''</sup>}},对应的[[二次型]]
<math>n \times n</math>的实对称矩阵<math>\mathbf{A}</math>如果满足对所有非零向量<math>\mathbf{x}\in \mathbf{R}^n</math>,对应的[[二次型]]
:<math>Q(\mathbf{x})=\mathbf{x}^\mathrm{T}\mathbf{Ax}</math>
:<cite id=quadratic_forms>{{math|''Q''('''x''')}} <math>=</math> {{math|'''x'''<sup>T</sup>'''Ax'''}}</cite>

函数值都是正数,就称{{math|'''A'''}}为正定矩阵。类似地还有半正定矩阵、负定矩阵、不定矩阵等概念<ref>{{Harvard citations |last1=Horn |last2=Johnson |year=1985 |nb=yes |loc=Chapter 7 }}</ref>。对称矩阵的正定性与其特征值密切相关。矩阵是正定的当且仅当其特征值都是正数<ref>{{Harvard citations |last1=Horn |last2=Johnson |year=1985 |nb=yes |loc=Theorem 7.2.1 }}</ref>。
[[函数值]]都是正数,就称<math>\mathbf{A}</math>为正定矩阵。类似地还有半正定矩阵、负定矩阵、不定矩阵等概念<ref>{{Harvard citations |last1=Horn |last2=Johnson |year=1985 |nb=yes |loc=Chapter 7 }}</ref>。对称矩阵的正定性与其特征值密切相关。矩阵是正定的当且仅当其特征值都是正数<ref>{{Harvard citations |last1=Horn |last2=Johnson |year=1985 |nb=yes |loc=Theorem 7.2.1 }}</ref>。


==矩阵的计算==
==矩阵的计算==
矩阵在许多学科领域中都有应用,在很多时候,除了需要知道矩阵的理论性质以外,还需要计算矩阵的数值。为了矩阵的计算能够足够精确与快捷,[[数值线性代数]]中专门有研究矩阵的数值计算方法<ref>{{Harvard citations |last1=Bau III |last2=Trefethen |year=1997 |nb=yes }}</ref>。与其它的数值计算一样,矩阵的数值计算注重的主要也是[[算法]]的[[复杂度]]和[[数值稳定性]]。矩阵的数值计算可以使用直接计算,也可以用迭代算法,例如在计算方块矩阵的特征值时,可以从一个非零向量{{math|''x''}}<sub>0</sub>开始,通过特定迭代方法得到一个[[极限|逼近]]某个特征向量的向量序列<ref>{{Harvard citations |last1=Householder |year=1975 |loc=Ch. 7 |nb=yes }}</ref>。
矩阵在许多学科领域中都有应用,在很多时候,除了需要知道矩阵的理论性质以外,还需要计算矩阵的数值。为了矩阵的计算能够足够精确与快捷,[[数值线性代数]]中专门有研究矩阵的数值计算方法<ref>{{Harvard citations |last1=Bau III |last2=Trefethen |year=1997 |nb=yes }}</ref>。与其它的数值计算一样,矩阵的数值计算注重的主要也是[[算法]]的[[复杂度]]和[[数值稳定性]]。矩阵的数值计算可以使用直接计算,也可以用迭代算法,例如在计算方块矩阵的特征值时,可以从一个非零向量<math>x_0</math>开始,通过特定迭代方法得到一个[[极限 (序列)|逼近]]某个特征向量的向量序列<ref>{{Harvard citations |last1=Householder |year=1975 |loc=Ch. 7 |nb=yes }}</ref>。


测量一个算法的复杂度是指估计此算法需要的基本运算如数字的加法和乘法的次数,或者找出它的一个上界。例如按照定义计算的话,两个{{math|''n''}} 阶方阵的乘法需要{{math|''n''}}<sup>3</sup>次数字乘法计算,因为其乘积是一个{{math|''n''}}阶方阵,有{{math|''n''}}<sup>2</sup>个元素,计算每个元素需要{{math|''n''}}次数字乘法。如果使用[[施特拉森算法]]的话,可以将数字乘法的次数减低到大约{{math|''n''}}<sup>2.8</sup>次<ref>{{Harvard citations |last1=Golub |last2=Van Loan |year=1996 |nb=yes |loc=Algorithm 1.3.1 }}</ref>。此外,编程语言或环境本身对算法的复杂度也会有影响。
测量一个算法的复杂度是指估计此算法需要的基本运算如数字的加法和乘法的次数,或者找出它的一个上界。例如按照定义计算的话,两个<math>n</math>阶方阵的乘法需要<math>n^3</math>次数字乘法计算,因为其乘积是一个<math>n</math>阶方阵,有<math>n^2</math>个元素,计算每个元素需要<math>n</math>次数字乘法。如果使用[[施特拉森算法]]的话,可以将数字乘法的次数减低到大约<math>n^{2.8}</math>次<ref>{{Harvard citations |last1=Golub |last2=Van Loan |year=1996 |nb=yes |loc=Algorithm 1.3.1 }}</ref>。此外,编程语言或环境本身对算法的复杂度也会有影响。


某些特殊类型的矩阵携带的数据量比一般矩阵要少,同时带来的信息量比一般矩阵多。一个重要的例子是稀疏矩阵,这类矩阵中绝大部分的元素是零。有关稀疏矩阵的计算,如计算稀疏矩阵{{math|'''A'''}}的线性方程组{{math|'''Ax'''}} <math>=</math> {{math|'''b'''}}时,可以使用一些专用于稀疏矩阵的特殊算法(比如[[共轭梯度法]]<ref>{{Harvard citations |last1=Golub |last2=Van Loan |year=1996 |nb=yes |loc=Chapters 9 and 10, esp. section 10.2 }}</ref>),减低计算复杂度。
某些特殊类型的矩阵携带的数据量比一般矩阵要少,同时带来的信息量比一般矩阵多。一个重要的例子是稀疏矩阵,这类矩阵中绝大部分的元素是零。有关稀疏矩阵的计算,如计算稀疏矩阵<math>\mathbf{A}</math>的线性方程组<math>\mathbf{Ax}=\mathbf{b}</math>时,可以使用一些专用于稀疏矩阵的特殊算法(比如[[共轭梯度法]]<ref>{{Harvard citations |last1=Golub |last2=Van Loan |year=1996 |nb=yes |loc=Chapters 9 and 10, esp. section 10.2 }}</ref>),减低计算复杂度。


算法的数值稳定性是指输入值的小变化不会让计算结果产生很大偏差。例如计算矩阵的逆时,可以用以下的算法(其中{{math|adj('''A''')}}表示{{math|'''A'''}}的[[伴随矩阵]])
算法的数值稳定性是指输入值的小变化不会让计算结果产生很大偏差。例如计算[[逆矩陣|矩阵的逆]]时,可以用以下的算法(其中<math>\mathrm{adj}(\mathbf{A})</math>表示<math>\mathbf{A}</math>的[[伴随矩阵]],<math>\mathrm{det}(\mathbf{A})</math>表示<math>\mathbf{A}</math>的[[行列式]])
:<math>\mathbf{A}^{-1}=\frac{\operatorname{adj}(\mathbf{A})}{\det(\mathbf{A})}</math>
:{{math|'''A'''<sup>−1</sup>}} <math>=</math> {{math|Adj('''A''') / det('''A''')}}


这个算法在{{math|'''A'''}}的行列式接近0的时候会引起很大的[[舍入误差]]<ref>{{Harvard citations |last1=Golub |last2=Van Loan |year=1996 |nb=yes |loc=Chapter 2.3 }}</ref>。而如果使用全选主元的高斯消去法求逆,则在复杂度降低的同时能够避免舍入误差,保证数值稳定性。
这个算法在<math>\mathbf{A}</math>的行列式接近0的时候会引起很大的[[舍入误差]]<ref>{{Harvard citations |last1=Golub |last2=Van Loan |year=1996 |nb=yes |loc=Chapter 2.3 }}</ref>。而如果使用全选主元的高斯消去法求逆,则在复杂度降低的同时能够避免舍入误差,保证数值稳定性。


===矩阵分解===
===矩阵分解===
第372行: 第458行:
矩阵研究的一大方向是将一般的矩阵用一些比较“简单”的矩阵来表示。这种表示方式称为矩阵的变换与分解。矩阵变换与分解的方法有很多,它们的目的都是希望化简后的矩阵保持原矩阵的某些性质,比如行列式、秩或逆矩阵,而形式相对简单,因而能用容易地进行讨论和计算,或者能使得某些算法更易执行。
矩阵研究的一大方向是将一般的矩阵用一些比较“简单”的矩阵来表示。这种表示方式称为矩阵的变换与分解。矩阵变换与分解的方法有很多,它们的目的都是希望化简后的矩阵保持原矩阵的某些性质,比如行列式、秩或逆矩阵,而形式相对简单,因而能用容易地进行讨论和计算,或者能使得某些算法更易执行。


[[LU分解]]将矩阵分解为一个下三角矩阵{{math|'''L'''}}和一个上三角矩阵{{math|'''U'''}}的乘积<ref>{{Harvard citations |last1=Press |last2=Flannery |last3=Teukolsky |year=1992 |nb=yes }} </ref>。分解后的矩阵可以方便某些问题的解决。例如解线性方程组时,如果将系数矩阵{{math|'''A'''}}分解成{{math|'''A'''}} <math>=</math> {{math|'''LU'''}}的形式,那么方程的求解可以分解为求解{{math|'''Ly'''}} <math>=</math> {{math|'''b'''}}和{{math|'''Ux'''}} <math>=</math> {{math|'''y'''}}两步,而后两个方程可以十分简洁地求解(详见[[三角矩阵]]中“向前与向后替换”一节)。又例如在求矩阵的行列式时,如果直接计算一个矩阵{{math|'''A'''}}的行列式,需要计算大约{{math|(''n'' + 1)!}} 次加法和乘法;而如果先对矩阵做{{math|'''LU'''}}分解,再求行列式,就只需要大约{{math|''n''}}<sup>3</sup>次加法和乘法,大大降低了计算次数。这是因为做{{math|'''LU'''}}分解的复杂度大约是{{math|''n''}}<sup>3</sup>次,而后注意到{{math|'''L'''}}和{{math|'''U'''}}是三角矩阵,所以求它们的行列式只需要将主对角线上元素相乘即可。
[[LU分解]]将矩阵分解为一个下三角矩阵<math>\mathbf{L}</math>和一个上三角矩阵<math>\mathbf{U}</math>的乘积<ref>{{Harvard citations |last1=Press |last2=Flannery |last3=Teukolsky |year=1992 |nb=yes }} </ref>。分解后的矩阵可以方便某些问题的解决。例如解线性方程组时,如果将系数矩阵<math>\mathbf{A}</math>分解成<math>\mathbf{A}=\mathbf{LU}</math>的形式,那么方程的求解可以分解为求解<math>\mathbf{Ly}=\mathbf{b}</math><math>\mathbf{Ux}=\mathbf{y}</math>两步,而后两个方程可以十分简洁地求解(详见[[三角矩阵]]中“向前与向后替换”一节)。又例如在求矩阵的行列式时,如果直接计算一个矩阵<math>\mathbf{A}</math>的行列式,需要计算大约<math>(n+1)!</math>次加法和乘法;而如果先对矩阵做<math>\mathbf{LU}</math>分解,再求行列式,就只需要大约<math>n^3</math>次加法和乘法,大大降低了计算次数。这是因为做<math>\mathbf{LU}</math>分解的复杂度大约是<math>n^3</math>次,而后注意到<math>\mathbf{L}</math><math>\mathbf{U}</math>是三角矩阵,所以求它们的行列式只需要将主对角线上元素相乘即可。


[[File:Jordan blocks.svg|right|thumb|若尔当矩阵,其中灰色框内的是若尔当块]]
[[File:Jordan blocks.svg|thumb|若尔当矩阵,其中灰色框内的是若尔当块]]
高斯消去法也是一种矩阵分解方法。通过初等变换操作,可以将任何矩阵变为[[阶梯形矩阵]],而每个操作可以看做是将矩阵乘上一个特定的[[初等矩阵]]<ref>{{Harvard citations |last1=Stoer |last2=Bulirsch |year=2002 |nb=yes |loc=Section 4.1 }}</ref>。[[奇异值分解]]则是另一种分解方法,将一个矩阵表示成3个矩阵的乘积:{{math|'''A'''}} <math>=</math> {{math|'''UDV'''}}。其中{{math|'''U'''}}和{{math|'''V'''}}是[[酉矩阵]],{{math|'''D'''}}是[[对角矩阵]]。
高斯消去法也是一种矩阵分解方法。通过初等变换操作,可以将任何矩阵变为[[阶梯形矩阵]],而每个操作可以看做是将矩阵乘上一个特定的[[初等矩阵]]<ref>{{Harvard citations |last1=Stoer |last2=Bulirsch |year=2002 |nb=yes |loc=Section 4.1 }}</ref>。[[奇异值分解]]则是另一种分解方法,将一个矩阵表示成3个矩阵的乘积:<math>\mathbf{A}=\mathbf{UDV}</math>。其中<math>\mathbf{U}</math><math>\mathbf{V}</math>是[[酉矩阵]],<math>\mathbf{D}</math>是[[对角矩阵]]。


[[特征分解]]是将一个矩阵{{math|'''A'''}}写成{{math|'''PDP'''}}<sup>−1</sup>的形式,其中{{math|'''P'''}}是一个可逆矩阵,{{math|'''D'''}}是对角矩阵<ref>{{Harvard citations |last1=Horn |last2=Johnson |year=1985 |nb=yes |loc=Theorem 2.5.4 }}</ref>。如果{{math|'''A'''}}的特征分解存在,就称它是可对角化的矩阵。不能对角化的矩阵,也有类似的分解方式。任意的矩阵{{math|'''A'''}}都可以写成{{math|'''PJP'''}}<sup>−1</sup>的形式,其中的矩阵{{math|'''J'''}}是[[若尔当标准型]]。若尔当标准型是矩阵的一种,它与对角矩阵类似,只不过主对角线上的元素不是数值,而是若尔当块:主对角线上为同一元素<math>\lambda_i</math>,主对角线右上一行的次对角线上都是1,其它元素都是0的矩阵(见右图)<ref>{{Harvard citations |last1=Horn |last2=Johnson |year=1985 |nb=yes |loc=Ch. 3.1, 3.2 }}</ref>。特征分解可以方便计算矩阵的[[幂次]]和多项式,如要计算{{math|'''A'''<sup>''n''</sup>}}
[[特征分解]]是将一个矩阵<math>\mathbf{A}</math>写成<math>\mathbf{PDP}^{-1}</math>的形式,其中<math>\mathbf{P}</math>是一个可逆矩阵,<math>\mathbf{D}</math>是对角矩阵<ref>{{Harvard citations |last1=Horn |last2=Johnson |year=1985 |nb=yes |loc=Theorem 2.5.4 }}</ref>。如果<math>\mathbf{A}</math>的特征分解存在,就称它是可对角化的矩阵。不能对角化的矩阵,也有类似的分解方式。任意的矩阵<math>\mathbf{A}</math>都可以写成<math>\mathbf{PJP}^{-1}</math>的形式,其中的矩阵<math>\mathbf{J}</math>是[[若尔当标准型]]。若尔当标准型是矩阵的一种,它与对角矩阵类似,只不过主对角线上的元素不是数值,而是若尔当块:主对角线上为同一元素<math>\lambda_i</math>,主对角线右上一行的次对角线上都是1,其它元素都是0的矩阵(见右图)<ref>{{Harvard citations |last1=Horn |last2=Johnson |year=1985 |nb=yes |loc=Ch. 3.1, 3.2 }}</ref>。特征分解可以方便计算矩阵的[[幂次]]和多项式,如要计算<math>\mathbf{A}^n</math>:

:{{math|'''A'''<sup>''n''</sup>}} <math>=</math> {{math|('''PDP'''}}<sup>−1</sup>{{math|)<sup>''n''</sup>}} <math>=</math> {{math|'''PDP'''}}<sup>−1</sup>{{math|'''PDP'''}}<sup>−1</sup>...{{math|'''PDP'''}}<sup>−1</sup> <math>=</math> {{math|'''PD'''<sup>''n''</sup> '''P'''}}<sup>−1</sup>
:<math>\mathbf{A}^n=(\mathbf{PDP}^{-1})^n=\mathbf{PDP}^{-1}\mathbf{PDP}^{-1}\ldots\mathbf{PDP}^{-1}=\mathbf{PD}^n\mathbf{P}^{-1}</math>
而其中对角矩阵的幂次{{math|'''D'''<sup>''n''</sup>}}要比{{math|'''A'''<sup>''n''</sup>}}容易计算得多。同理还可计算[[矩阵指数]]:{{math|''e''<sup>'''A'''</sup>}}(在[[线性微分方程]]中有应用)、[[矩阵对数]]和[[矩阵的平方根]]<ref>{{Harvard citations |last1=Arnold |last2=Cooke |year=1992 |nb=yes |loc=Sections 14.5, 7, 8 }}</ref>。为了提高算法的数值稳定性,还有[[舒尔分解]]等矩阵分解方法<ref>{{Harvard citations |last1=Bronson |year=1989 |nb=yes |loc=Ch. 15 }}</ref>。

而其中对角矩阵的幂次<math>\mathbf{D}^n</math>要比<math>\mathbf{A}^n</math>容易计算得多。同理还可计算[[矩阵指数]]:<math>e^\mathbf{A}</math>(在[[线性微分方程]]中有应用)、[[矩阵对数]]和[[矩阵的平方根]]<ref>{{Harvard citations |last1=Arnold |last2=Cooke |year=1992 |nb=yes |loc=Sections 14.5, 7, 8 }}</ref>。为了提高算法的数值稳定性,还有[[舒尔分解]]等矩阵分解方法<ref>{{Harvard citations |last1=Bronson |year=1989 |nb=yes |loc=Ch. 15 }}</ref>。


==矩阵的推广==
==矩阵的推广==
矩阵的元素除了可以是实数和复数以外,也可以任意环或域中元素。在线性代数中,矩阵的性质可以经由有限维的线性空间中的线性变换定义。更广泛的,无限维空间中的[[线性算子]],则可以定义更广泛的无穷维矩阵。矩阵的另一种推广是[[张量]]。标量可以看成零维方式排列的数据(只有一个“点”),向量可以看成是一维方式排列的数据(若干个“点”排成的“线段”),矩阵可以看成是二维方式排列的数据(若干个“线段”排成的“矩形”),而张量的概念则包括了这几种排列方式。在张量的概念中,标量是零维张量,向量是一维张量,矩阵是二维量,而更高维方式排列的数据方式就是高维张量<ref>{{Harvard citations |last1=Coburn |year=1955 |nb=yes |loc=Ch. V }}</ref>。
矩阵的元素除了可以是实数和复数以外,也可以任意环或[[ (數學)|域]]中元素。在线性代数中,矩阵的性质可以经由有限维的线性空间中的线性变换定义。更广泛的,无限维空间中的[[线性算子]],则可以定义更广泛的无穷维矩阵。矩阵的另一种推广是[[张量]]。标量可以看成零维方式排列的数据(只有一个“点”),向量可以看成是一维方式排列的数据(若干个“点”排成的“线段”),矩阵可以看成是二维方式排列的数据(若干个“线段”排成的“矩形”),而张量的概念则包括了这几种排列方式。在张量的概念中,标量是零维张量,向量是一维张量,矩阵是二维量,而更高维方式排列的数据方式就是高维张量<ref>{{Harvard citations |last1=Coburn |year=1955 |nb=yes |loc=Ch. V }}</ref>。


===一般域和环上的矩阵===
===一般域和环上的矩阵===
矩阵的元素除了可以是实数和复数以外,还可以是任何能够使得矩阵的运算律成立的元素。首先,矩阵的元素可以是任意一个域(即能够进行“加减乘除”运算的集合)中元素。例如[[编码理论]]中会出现系数为[[有限域]]中元素的矩阵,以及有理数系数的矩阵。如果矩阵的系数所在域'''K'''不是[[代数闭域]],那么在求矩阵的特征值时,由于特征值是相应的特征多项式的根,可能不在系数域'''K'''中,而是在系数域的某个扩域'''L'''中。反过来,如果考虑[[代数扩张|扩域]]'''L/K''',以及'''L'''中的一个元素<math>\alpha</math>,以及'''L'''中线性变换<math>m_{\alpha} : \, x \mapsto \alpha x</math>,那么由于<math>m_{\alpha}</math>也是一个'''K'''-线性变换,它可以表示成一个''n''×''n'''''K'''系数矩阵<math>X_{\alpha}</math> ,其中的''n''是扩域'''L/K'''的阶数。<math>\alpha</math>是这个矩阵的特征值,这个矩阵的特征多项式 <math> p_{X_{\alpha} }</math>是<math>\alpha</math>在'''K'''中的[[最小多项式]]<math> \operatorname{min}_{\mathbf{K}} (\alpha) </math>的幂次:
矩阵的元素除了可以是实数和复数以外,还可以是任何能够使得矩阵的运算律成立的元素。首先,矩阵的元素可以是任意一个域(即能够进行“加减乘除”运算的集合)中元素。例如[[编码理论]]中会出现系数为[[有限域]]中元素的矩阵,以及有理数系数的矩阵。如果矩阵的系数所在域<math>\mathbf{K}</math>不是[[代数闭域]],那么在求矩阵的特征值时,由于特征值是相应的特征多项式的根,可能不在系数域<math>\mathbf{K}</math>中,而是在系数域的某个扩域'''L'''中。反过来,如果考虑[[代数扩张|扩域<math>\mathbf{L/K}</math>]],以及<math>\mathbf{L}</math>中的一个元素<math>\alpha</math>,以及<math>\mathbf{L}</math>中线性变换<math>m_{\alpha} : \, x \mapsto \alpha x</math>,那么由于<math>m_{\alpha}</math>也是一个<math>\mathbf{K}</math>-线性变换,它可以表示成一个<math>n \times n</math><math>\mathbf{K}</math>系数矩阵<math>X_{\alpha}</math>,其中的<math>n</math>是扩域[[代数扩张|<math>\mathbf{L/K}</math>]]的阶数。<math>\alpha</math>是这个矩阵的特征值,这个矩阵的特征多项式<math> p_{X_{\alpha} }</math>是<math>\alpha</math>在<math>\mathbf{K}</math>中的[[最小多项式]]<math> \operatorname{min}_{\mathbf{K}} (\alpha) </math>的幂次:
: <math> p_{X_{\alpha} } = \left( \operatorname{min}_{\mathbf{K}} (\alpha) \right)^r \,. </math>
其中的<math>r</math>是扩域'''L/K''' <math>(\alpha)</math>的阶数<ref>{{Harvard citations |last1= Ash |year= 2012|nb=yes |loc= Chapter II }}</ref>。


: <math> p_{X_{\alpha} } = \left( \operatorname{min}_{\mathbf{K}} (\alpha) \right)^r \,</math>。其中的<math>r</math>是扩域[[代数扩张|<math>\mathbf{L/K}</math>]] <math>(\alpha)</math>的阶数<ref>{{Harvard citations |last1= Ash |year= 2012|nb=yes |loc= Chapter II }}</ref>。
更一般的情况是矩阵的元素属于某个环'''R'''<ref>{{Harvard citations |last1=Lang |year=2002 |nb=yes |loc=Chapter XIII }}</ref>。环是比域更广泛的概念,只要求其中元素能够进行加减法和乘法运算(不一定能定义除法)。给定一个环 '''R''',<math>\mathcal{M}(m,n,\mathbf{R})</math>中的矩阵之间可以相互加减以及相乘,所以<math>\mathcal{M}(m,n,\mathbf{R})</math>关于矩阵的加法和乘法也构成一个环,称为[[矩阵环]]。''n''维方阵的环<math>\mathcal{M}(n,\mathbf{R})</math>與左'''R'''-[[模]]'''R'''<sup>n</sup>的[[自同態]]環[[同構]]<ref>{{Harvard citations |last1=Lang |year=2002 |nb=yes |loc=XVII.1, p. 643 }}</ref>。


更一般的情况是矩阵的元素属于某个环<math>\mathbf{R}</math><ref>{{Harvard citations |last1=Lang |year=2002 |nb=yes |loc=Chapter XIII }}</ref>。环是比域更广泛的概念,只要求其中元素能够进行加减法和乘法运算(不一定能定义除法)。给定一个环<math>\mathbf{R}</math>,<math>\mathcal{M}(m,n,\mathbf{R})</math>中的矩阵之间可以相互加减以及相乘,所以<math>\mathcal{M}(m,n,\mathbf{R})</math>关于矩阵的加法和乘法也构成一个环,称为[[矩阵环]]。<math>n</math>维方阵的环<math>\mathcal{M}(n,\mathbf{R})</math>與左<math>\mathbf{R}</math>-[[模|模<math>\mathbf{R}^n</math>]]的[[自同態]]環[[同構]]<ref>{{Harvard citations |last1=Lang |year=2002 |nb=yes |loc=XVII.1, p. 643 }}</ref>。
若'''R'''是[[交换环]],則<math>\mathcal{M}(m,\mathbf{R})</math>是一个帶[[單位元]]的'''R'''-[[代數 (環論)|代數]],满足结合律,但不满足交换律。其中的矩阵仍然可以用莱布尼兹公式定義[[行列式]]。一个矩阵可逆当且仅当其行列式为环'''R'''中的[[可逆元]](域上的矩阵可逆只需行列式不等于0)<ref>{{Harvard citations |last1=Lang |year=2002 |nb=yes |loc=Proposition XIII.4.16 }}</ref>。

若<math>\mathbf{R}</math>是[[交换环]],則<math>\mathcal{M}(m,\mathbf{R})</math>是一个帶[[單位元]]的<math>\mathbf{R}</math>-[[代數 (環論)|代數]],满足结合律,但不满足交换律。其中的矩阵仍然可以用莱布尼兹公式定義[[行列式]]。一个矩阵可逆当且仅当其行列式为环<math>\mathbf{R}</math>中的[[可逆元]](域上的矩阵可逆只需行列式不等于0)<ref>{{Harvard citations |last1=Lang |year=2002 |nb=yes |loc=Proposition XIII.4.16 }}</ref>。


===矩阵与线性变换===
===矩阵与线性变换===
前面已经提到,所有'''R'''<sup>''n''</sup> → '''R'''<sup>''m''</sup>的线性变换都对应着一个<math>\mathcal{M}(m,n,\mathbf{R})</math>中的矩阵。更一般地,给定了基底后,任意两个有限维线性空间之间的线性映射''f'': '''V''' → '''W'''也对应着一个矩阵'''A'''<sub>f</sub>= (''a''<sub>''ij''</sub>)。设空间'''V''''''W'''的基底分别是'''v'''<sub>1</sub>, ..., '''v'''<sub>''n''</sub> '''w'''<sub>1</sub>, ..., '''w'''<sub>''m''</sub>,那么
前面已经提到,所有<math>\mathbf{R}^n\rightarrow \mathbf{R}^m</math>的线性变换都对应着一个<math>\mathcal{M}(m,n,\mathbf{R})</math>中的矩阵。更一般地,给定了基底后,任意两个有限维线性空间之间的线性映射<math>f:\mathbf{V}\rightarrow\mathbf{W}</math>也对应着一个矩阵<math>\mathbf{A}_f=(a_{ij})</math>。设空间<math>\mathbf{V}</math><math>\mathbf{W}</math>的基底分别是<math>\mathbf{v}_1,\ldots,\mathbf{v}_n</math>和<math>\mathbf{w}_1,\ldots,\mathbf{w}_m</math>,那么
:对任意 <math> j=1,\ldots,n </math> , <math>f(\mathbf{v}_j) = \sum_{i=1}^m a_{i,j} \mathbf{w}_i</math>
矩阵'''A'''<sub>f</sub>实际上“记录”了'''V'''中每个基底向量经过变换后得到的'''W'''中的像在基底('''w'''<sub>1</sub>, ..., '''w'''<sub>''m''</sub>)下的形式。要注意矩阵的内容取决于基底的选择。可以说,矩阵是线性变换''f'' 在特定“角度”(基底)下的“素描”。不同的“角度”下,描述''f'' 的矩阵是不同的,但这些矩阵都是[[相似矩阵]]<ref>{{Harvard citations |last1=Greub |year=1975 |nb=yes |loc=Section III.3 }}</ref>。与矩阵有关的基本概念都可以用线性变换的层面来解释,比如一个矩阵的转置可以用''f'' 的[[对偶空间|对偶变换]]''f''<sup>*</sup> : '''W'''<sup>*</sup> → '''V'''<sup>*</sup>来表示<ref>{{Harvard citations |last1=Greub |year=1975 |nb=yes |loc=Section III.3.13 }}</ref>。


:对任意 <math> j=1,\ldots,n </math>,<math>f(\mathbf{v}_j) = \sum_{i=1}^m a_{i,j} \mathbf{w}_i</math>
当矩阵的元素是带单位元的环'''R'''中的元素时,''m''×''n''的'''R'''-矩阵对应的则是'''R'''-[[自由模]]'''R'''<sup>''m''</sup>和'''R'''<sup>''n''</sup>之间的'''R'''-线性变换。''n''&nbsp;=&nbsp;''m'' 的时候,这些'''R'''-线性变换可以相互复合,因此''n''维的'''R'''-矩阵环能够与'''R'''-自同态环'''R'''<sup>''n''</sup>同构。

矩阵<math>\mathbf{A}_f</math>实际上“记录”了<math>\mathbf{V}</math>中每个基底向量经过变换后得到的<math>\mathbf{W}</math>中的像在基底<math>(\mathbf{w}_1,\ldots,\mathbf{w}_m)</math>下的形式。要注意矩阵的内容取决于基底的选择。可以说,矩阵是线性变换''f''在特定“角度”(基底)下的“素描”。不同的“角度”下,描述<math>f</math>的矩阵是不同的,但这些矩阵都是[[相似矩阵]]<ref>{{Harvard citations |last1=Greub |year=1975 |nb=yes |loc=Section III.3 }}</ref>。与矩阵有关的基本概念都可以用线性变换的层面来解释,比如一个矩阵的转置可以用''f''的[[对偶空间|对偶变换]]''<math>f^*:\mathbf{W}^*\rightarrow\mathbf{V}^*</math>''来表示<ref>{{Harvard citations |last1=Greub |year=1975 |nb=yes |loc=Section III.3.13 }}</ref>。

当矩阵的元素是带单位元的环<math>\mathbf{R}</math>中的元素时,<math>m \times n</math>的<math>\mathbf{R}</math>-矩阵对应的则是<math>\mathbf{R}</math>-[[自由模|自由模<math>\mathbf{R}^m</math>]]和<math>\mathbf{R}^n</math>之间的'''<math>\mathbf{R}</math>'''-线性变换。<math>n=m</math>的时候,这些'''<math>\mathbf{R}</math>'''-线性变换可以相互复合,因此<math>n</math>维的<math>\mathbf{R}</math>-矩阵环能够与<math>\mathbf{R}</math>-自同态环<math>\mathbf{R}^n</math>同构。


===矩阵群===
===矩阵群===
{{Main|矩阵群}}
{{Main|矩阵群}}
[[群]]是比环更宽泛的代数结构,只需要集合配备一个满足结合律的[[二元运算]],即将两个群内元素映射到群内一元素的运算。矩阵群是指矩阵关于矩阵乘法组成的群<ref>{{Harvard citations |last1=Baker |year=2003 |nb=yes |loc=Def. 1.30 }}</ref>。显然,只有方块矩阵才能构成乘法群。所有''n''维的可逆方阵构成一个群,称为''n''阶[[一般线性群]]。由于群内每个元素都必须是可逆的,任意的矩阵群都必然是一般线性群的[[子群]]。
[[群]]是比环更宽泛的代数结构,只需要集合配备一个满足结合律的[[二元运算]],即将两个群内元素映射到群内一元素的运算。矩阵群是指矩阵关于矩阵乘法组成的群<ref>{{Harvard citations |last1=Baker |year=2003 |nb=yes |loc=Def. 1.30 }}</ref>。显然,只有方块矩阵才能构成乘法群。所有<math>n</math>维的可逆方阵构成一个群,称为<math>n</math>阶[[一般线性群]]。由于群内每个元素都必须是可逆的,任意的矩阵群都必然是一般线性群的[[子群]]。
能够在矩阵乘法和求逆矩阵运算下保持的性质都可以用来刻画一定的矩阵群。例如所有行列式为1的矩阵可以构成一个群,称为''n''阶[[特殊线性群]]<ref>{{Harvard citations |last1=Baker |year=2003 |nb=yes |loc=Theorem 1.2 }}</ref>。所有''n''维的[[正交矩阵]],即满足:
能够在矩阵乘法和求逆矩阵运算下保持的性质都可以用来刻画一定的矩阵群。例如所有行列式为1的矩阵可以构成一个群,称为<math>n</math>阶[[特殊线性群]]<ref>{{Harvard citations |last1=Baker |year=2003 |nb=yes |loc=Theorem 1.2 }}</ref>。所有<math>n</math>维的[[正交矩阵]],即满足:
:<math>\mathbf{M}^\mathrm{T}\mathbf{M}=\mathbf{I}</math>
:'''M'''<sup>T</sup>'''M''' = '''I'''

的矩阵'''M'''也构成一个群,称为''n''阶[[正交群]]<ref>{{Harvard citations |last1=Artin |year=1991 |nb=yes |loc=Chapter 4.5 }}</ref>。正交矩阵得名于它在'''R'''<sup>''n''</sup>中对应的线性变换具有保角性,也就是说对基本的[[点积]],满足
:('''Mv''') · ('''Mw''') = '''v''' · '''w'''.<ref>{{Harvard citations |last1=Artin |year=1991 |nb=yes |loc=Theorem 4.5.13 }}</ref>
的矩阵<math>\mathbf{M}</math>也构成一个群,称为<math>n</math>阶[[正交群]]<ref>{{Harvard citations |last1=Artin |year=1991 |nb=yes |loc=Chapter 4.5 }}</ref>。正交矩阵得名于它在<math>\mathbf{R}^n</math>中对应的线性变换具有保角性,也就是说对基本的[[点积]],满足
:<math>(\mathbf{Mv})\cdot(\mathbf{Mw})=\mathbf{v}\cdot\mathbf{w}</math><ref>{{Harvard citations |last1=Artin |year=1991 |nb=yes |loc=Theorem 4.5.13 }}</ref>


每个[[有限群]]都同构于一个矩阵群。实际上,每个有限群都同构于某个[[置换群]]的子群,而每个置换群都同构于一个矩阵群(见置换群的[[正则群表示]]<ref>{{Harvard citations |last1=Rowen |year=2008 |loc=Example 19.2, p. 198 |nb=yes }}</ref>)鉴于矩阵群的性质可以通过与矩阵相关的更多手段更好地理解,常常通过研究矩阵群来研究一个有限群。相关的理论称为[[群表示论]]。
每个[[有限群]]都同构于一个矩阵群。实际上,每个有限群都同构于某个[[置换群]]的子群,而每个置换群都同构于一个矩阵群(见置换群的[[正则群表示]]<ref>{{Harvard citations |last1=Rowen |year=2008 |loc=Example 19.2, p. 198 |nb=yes }}</ref>)鉴于矩阵群的性质可以通过与矩阵相关的更多手段更好地理解,常常通过研究矩阵群来研究一个有限群。相关的理论称为[[群表示论]]。
第413行: 第504行:
===无限维矩阵===
===无限维矩阵===
{{main|无限维矩阵}}
{{main|无限维矩阵}}
无穷维矩阵可以指行数或列数无穷大,或两者都是无穷大的矩阵<ref>{{Harvard citations |editor1-last=Itõ |year=1987 |nb=yes }}</ref>。尽管这样的矩阵无法完整写出,但只要知道每行每列的元素的值,仍然可以对它进行矩阵操作和运算。这-{zh-hans:; zh-hant:裏;}-矩阵的行数和列数甚至不一定需要是[[可数集]]。需要注意的是,无穷维矩阵的乘法涉及到[[无穷级数]]求和,因此只有在相关的无穷级数[[级数#无穷级数的敛散性|收敛]]的时候,才能定义矩阵的乘积<ref>{{Harvard citations |last1= Thankappan |year=1993 |nb=yes|第491页}}</ref>。无限维矩阵也可以是方块矩阵,定义为行标记集合与列标记集合相同的矩阵(如<math>\mathbb{N} \times \mathbb{N}</math>)<ref>{{Harvard citations |last1= Thankappan |year=1993 |nb=yes|第492页}}</ref>。
无穷维矩阵可以指行数或列数无穷大,或两者都是无穷大的矩阵<ref>{{Harvard citations |editor1-last=Itõ |year=1987 |nb=yes }}</ref>。尽管这样的矩阵无法完整写出,但只要知道每行每列的元素的值,仍然可以对它进行矩阵操作和运算。这里矩阵的行数和列数甚至不一定需要是[[可数集]]。需要注意的是,无穷维矩阵的乘法涉及到[[无穷级数]]求和,因此只有在相关的无穷级数[[级数#无穷级数的敛散性|收敛]]的时候,才能定义矩阵的乘积<ref>{{Harvard citations |last1= Thankappan |year=1993 |nb=yes|第491页}}</ref>。无限维矩阵也可以是方块矩阵,定义为行标记集合与列标记集合相同的矩阵(如<math>\mathbb{N} \times \mathbb{N}</math>)<ref>{{Harvard citations |last1= Thankappan |year=1993 |nb=yes|第492页}}</ref>。


无限矩阵无法定义通常意义上的行列式,因此可逆矩阵不一定是方块矩阵,同理,酉矩阵也不一定要是方块矩阵<ref>{{Harvard citations |last1= Thankappan |year=1993 |nb=yes|第493页}}</ref>。
无限矩阵无法定义通常意义上的行列式,因此可逆矩阵不一定是方块矩阵,同理,酉矩阵也不一定要是方块矩阵<ref>{{Harvard citations |last1= Thankappan |year=1993 |nb=yes|第493页}}</ref>。
第419行: 第510行:
===空矩阵===
===空矩阵===
{{main|空矩阵}}
{{main|空矩阵}}
空矩阵是指行数或列数为零的矩阵。空矩阵的定义可以完善一些关于[[零维空间]]的约定。包括约定一个矩阵与空矩阵相乘得到的也是空矩阵,两个''n''×00×''p''的空矩阵相乘是一个''n''×''p''的零矩阵(所有元素都是零的矩阵)。0×0的空矩阵的行列式约定为1,所以它也可以有逆矩阵,约定为它自己<ref>{{Harvard citations|last1= Faliva |last2=Zoia |year= 2008 |nb=yes|第18页}}</ref>。
空矩阵是指行数或列数为零的矩阵。<ref>{{Cite web | url=http://omatrix.com/manual/glossary.htm | archive-url=https://web.archive.org/web/20090429015728/http://omatrix.com/manual/glossary.htm | archive-date=2009-04-29 | title="Empty Matrix: A matrix is empty if either its row or column dimension is zero"|publisher=O-Matrix v6 User Guide}}</ref><ref>{{Cite web | url=http://www.system.nada.kth.se/unix/software/matlab/Release_14.1/techdoc/matlab_prog/ch_dat29.html | title=Matrix - MATLAB Data Structures|publisher=system.nada.kth.se|quote=A matrix having at least one dimension equal to zero is called an empty matrix | archive-url=https://web.archive.org/web/20091228102653/http://www.system.nada.kth.se/unix/software/matlab/Release_14.1/techdoc/matlab_prog/ch_dat29.html | archive-date=2009-12-28}}</ref>空矩阵的定义可以完善一些关于[[零维空间]]的约定。包括约定一个矩阵与空矩阵相乘得到的也是空矩阵,两个<math>n \times 0</math><math>0 \times p</math>的空矩阵相乘是一个<math>n \times p</math>[[零矩阵]](所有元素都是零的矩阵)。0×0的空矩阵的行列式约定为1,所以它也可以有逆矩阵,约定为它自己<ref>{{Harvard citations|last1= Faliva |last2=Zoia |year= 2008 |nb=yes|第18页}}</ref>。


=== 分塊矩陣 ===
=== 分塊矩陣 ===
第432行: 第523行:
:<math>P_{11} = \begin{bmatrix}
:<math>P_{11} = \begin{bmatrix}
1 & 2 \\
1 & 2 \\
1 & 2 \end{bmatrix} P_{12} = \begin{bmatrix}
1 & 2 \end{bmatrix} , P_{12} = \begin{bmatrix}
3 & 2\\
3 & 2\\
7 & 5\end{bmatrix} P_{21} = \begin{bmatrix}
7 & 5\end{bmatrix} , P_{21} = \begin{bmatrix}
4 & 9 \\
4 & 9 \\
6 & 1 \end{bmatrix} P_{22} = \begin{bmatrix}
6 & 1 \end{bmatrix} , P_{22} = \begin{bmatrix}
2 & 6\\
2 & 6\\
5 & 8\end{bmatrix}</math>
5 & 8\end{bmatrix}</math>
第442行: 第533行:
:<math>P = \begin{bmatrix}
:<math>P = \begin{bmatrix}
P_{11} & P_{12}\\
P_{11} & P_{12}\\
P_{21} & P_{22}\end{bmatrix}</math>。将矩阵分块可以使得矩阵结构清晰,在某些时候可以方便运算、证明。两个大小相同、分块方式也相同的矩阵可以相加。行和列的块数符合矩阵乘法要求时,分块矩阵也可以相乘。将矩阵分块相乘的结果与直接相乘是一样的。用分块矩阵求逆,可以将高阶矩阵的求逆转化为多次低阶矩阵的求逆<ref>{{Harvard citations |last1= 居余马|year=2002 |loc=2.6 |nb=yes }}</ref>。
P_{21} & P_{22}\end{bmatrix}</math>。
将矩阵分块可以使得矩阵结构清晰,在某些时候可以方便运算、证明。两个大小相同、分块方式也相同的矩阵可以相加。行和列的块数符合矩阵乘法要求时,分块矩阵也可以相乘。将矩阵分块相乘的结果与直接相乘是一样的。用分块矩阵求逆,可以将高阶矩阵的求逆转化为多次低阶矩阵的求逆<ref>{{Harvard citations |last1= 居余马 |year=2002 |loc=2.6 |nb=yes }}</ref>。


==应用==
==应用==
第454行: 第544行:
这种表示法与复数的加减法、乘法都相兼容。比如,2×2的旋转矩阵可以用来表示模长为1的复数,一个向量乘以此旋转矩阵可以视作一个复数乘以该模长为1的复数。对[[四元数]]也有类似的矩阵表达<ref>{{Harvard citations |last1=Ward |year=1997 |loc=Ch. 2.8 |nb=yes }}</ref>。
这种表示法与复数的加减法、乘法都相兼容。比如,2×2的旋转矩阵可以用来表示模长为1的复数,一个向量乘以此旋转矩阵可以视作一个复数乘以该模长为1的复数。对[[四元数]]也有类似的矩阵表达<ref>{{Harvard citations |last1=Ward |year=1997 |loc=Ch. 2.8 |nb=yes }}</ref>。


早期的[[密码]]技术如[[希尔密码]]也用到矩阵。然而,矩阵的线性性质使这类密码相对容易破解<ref>{{Harvard citations |last1=Stinson |year=2005 |loc=Ch. 1.1.5 and 1.2.4 |nb=yes }}</ref>。[[计算机图像处理]]也会用到矩阵来表示处理对象,并且用放射旋转矩阵来计算对象的变换,实现三维对象在特定二维屏幕上的投影<ref>{{Harvard citations |last1=Association for Computing Machinery |year=1979 |loc=Ch. 7 |nb=yes }}</ref>。[[多项式环]]上的矩阵在[[控制论]]中有重要作用。
早期的[[密碼 (密碼學)|密码]]技术如[[希尔密码]]也用到矩阵。然而,矩阵的线性性质使这类密码相对容易破解<ref>{{Harvard citations |last1=Stinson |year=2005 |loc=Ch. 1.1.5 and 1.2.4 |nb=yes }}</ref>。[[计算机图像处理]]也会用到矩阵来表示处理对象,并且用放射旋转矩阵来计算对象的变换,实现三维对象在特定二维屏幕上的投影<ref>{{Harvard citations |last1=Association for Computing Machinery |year=1979 |loc=Ch. 7 |nb=yes }}</ref>。[[多项式环]]上的矩阵在[[控制论]]中有重要作用。


[[化学]]中也有矩阵的应用,特别在使用[[量子力学|量子理论]]讨论[[化学键|分子键]]和[[光谱]]的时候。具体例子有解[[罗特汉方程]]时用[[重叠矩阵]]和[[福柯矩阵]]来得到[[哈特里-福克]]方法中的[[分子轨道]]。
[[化学]]中也有矩阵的应用,特别在使用[[量子力学|量子理论]]讨论[[化学键|分子键]]和[[光谱]]的时候。具体例子有解[[罗特汉方程]]时用[[重叠矩阵]]和[[福柯矩阵]]来得到[[哈特里-福克]]方法中的[[分子轨道]]。


===图论===
===图论===
[[Image:Labelled undirected graph.svg|150px|thumb|right|一个无向图的邻接矩阵<math>\begin{bmatrix}
[[File:Labelled undirected graph.svg|150px|thumb|一个无向图的邻接矩阵<math>\begin{bmatrix}
2 & 1 & 0 \\
1 & 1 & 0 \\
1 & 0 & 1 \\
1 & 0 & 1 \\
0 & 1 & 0
0 & 1 & 0
\end{bmatrix}.</math>]]
\end{bmatrix}</math>]]
图论中可以用矩阵描述一个[[图 (图论)|有限图]]<ref>{{Harvard citations |last1=Godsil |last2=Royle |year=2004 |nb=yes |loc=Ch. 8.1 }}</ref>。这个矩阵叫做相关矩阵的[[邻接矩阵]],记录了图的每两个顶点之间是否有边连接。对简单图来说,邻接矩阵的元素只取两个值:0和1,第''i'' -{zh-hans:行; zh-hant:列;}-第''j'' -{zh-hans:列; zh-hant:行;}-上取值为0,表示没有从第''i'' 个顶点连到第''j'' 个顶点的边,取值为1则说明有。如果是一般情况的话,第''i'' -{zh-hans:行; zh-hant:列;}-第''j'' -{zh-hans:列; zh-hant:行;}-上的取值是从第''i'' 个顶点连到第''j'' 顶点的边的数目。[[距离矩阵]]则是表示图中各顶点之间距离的矩阵<ref>{{Harvard citations |last1=Punnen |year=2002 |nb=yes }}</ref>。在研究互联网等[[复杂网络]]的时候,邻接矩阵常常会是[[稀疏矩阵]]。因此[[网络理论]]中有专门研究稀疏矩阵的方面。
图论中可以用矩阵描述一个[[图 (图论)|有限图]]<ref>{{Harvard citations |last1=Godsil |last2=Royle |year=2004 |nb=yes |loc=Ch. 8.1 }}</ref>。这个矩阵叫做相关矩阵的[[邻接矩阵]],记录了图的每两个[[顶点 (图论)|顶点]]之间是否有边连接。对简单图来说,邻接矩阵的元素只取两个值:0和1,第<math>i</math>-{zh-cn:行; zh-tw:列;}-第<math>j</math>-{zh-cn:列; zh-tw:行;}-上取值为0,表示没有从第<math>i</math>个顶点连到第<math>j</math>个顶点的边,取值为1则说明有。如果是一般情况的话,第<math>i</math>-{zh-cn:行; zh-tw:列;}-第<math>j</math> -{zh-cn:列; zh-tw:行;}-上的取值是从第<math>i</math>个顶点连到第''j''个[[顶点 (图论)|顶点]]的边的数目。[[距离矩阵]]则是表示图中各顶点之间距离的矩阵<ref>{{Harvard citations |last1=Punnen |year=2002 |nb=yes }}</ref>。在研究互联网等[[复杂网络]]的时候,邻接矩阵常常会是[[稀疏矩阵]]。因此[[网络理论]]中有专门研究稀疏矩阵的方面。


===数学分析===
===数学分析===
在多元函数微积分学中,对二阶偏导数存在的函数''f'': '''R'''<sup>''n''</sup> → '''R''',可以定义其[[海森矩阵]]<ref>{{Harvard citations |last1=Lang |year=1987a |nb=yes |loc=Ch. XVI.6 }}</ref>:
在多元函数微积分学中,对二阶偏导数存在的函数<math>f:\mathbf{R}^n\rightarrow\mathbf{R}</math>,可以定义其[[海森矩阵]]<ref>{{Harvard citations |last1=Lang |year=1987a |nb=yes |loc=Ch. XVI.6 }}</ref>:
:<math>H(f)(x) = \left[ \frac {\partial^2 f}{\partial x_i \, \partial x_j}(x) \right ].</math>
:<math>H(f)(x) = \left[ \frac {\partial^2 f}{\partial x_i \, \partial x_j}(x) \right ]</math>
[[Image:Saddle point.png|left|thumb|n=2时,海森矩阵<math>\begin{bmatrix}
[[File:Saddle point.png|left|thumb|<math>n=2</math>时,海森矩阵<math>\begin{bmatrix}
2 & 0 \\
2 & 0 \\
0 & -2
0 & -2
\end{bmatrix}</math>的特征值一正一负,说明函数''f''(''x'',''y'') =&nbsp;''x''<sup>2</sup>&nbsp;−&nbsp;''y''<sup>2</sup>在 (''x''&nbsp;=&nbsp;0, ''y''&nbsp;=&nbsp;0) 处有一个[[鞍点]](红色点) ]]
\end{bmatrix}</math>的特征值一正一负,说明函数<math>f(x,y)=x^2-y^2</math>在<math>(x=0,y=0)</math>处有一个[[鞍点]](红色点)]]
严格来说,仅当函数在某一点上的二阶偏导数存在,才能定义这一点上的海森矩阵。海森矩阵给出了函数在这一点的变化率方面的信息。当给定的点'''x'''&nbsp;=&nbsp;(''x''<sub>1</sub>,&nbsp;...,&nbsp;''x''<sub>''n''</sub>)是函数[[平稳点]](即函数''f'' 在这一点上的一阶偏导数<math>\scriptstyle \frac{\partial f }{ \partial x_i}</math>都是0)时,就需要利用海森矩阵来查看函数在这一点周围的增长特性。多元函数在点'''x'''的[[泰勒展开]]是:
严格来说,仅当函数在某一点上的二阶偏导数存在,才能定义这一点上的海森矩阵。海森矩阵给出了函数在这一点的变化率方面的信息。当给定的点<math>\mathbf{x}=(x_1,\ldots,x_n)</math>是函数[[平稳点]](即函数<math>f</math>在这一点上的一阶偏导数<math>\frac{\partial f }{ \partial x_i}</math>都是0)时,就需要利用海森矩阵来查看函数在这一点周围的增长特性。多元函数在点<math>\mathbf{x}</math>的[[泰勒展开]]是:
:<math>f(x+h) = f(x) + \nabla f (x) \cdot h + \frac12 h^T H(f)(x) h + \circ \left( \| x \|^3\right) </math>
:<math>f(x+h) = f(x) + \nabla f (x) \cdot h + \frac12 h^T H(f)(x) h + \circ \left( \| x \|^3\right) </math>


如果函数在点'''x'''的一阶偏导数都是0,那么<math> \nabla f = 0</math>,所以函数在'''x'''附近的变化率取决于海森矩阵<math>H(f)(x)</math>的性质。如果<math>H(f)(x)</math>是正定矩阵,那么函数在点'''x'''取得局部最小值,如果是负定矩阵,则函数在'''x'''取得局部最大值。在这类情况下,关于函数''f'' 的条件最优化问题可以转变为关于海森矩阵的[[二次规划]]问题<ref>{{Harvard citations |last1=Nocedal |year=2006 |loc=Ch. 16 |nb=yes }}</ref>。
如果函数在点'''x'''的一阶偏导数都是0,那么<math> \nabla f = 0</math>,所以函数在'''x'''附近的变化率取决于海森矩阵<math>H(f)(x)</math>的性质。如果<math>H(f)(x)</math>是正定矩阵,那么函数在点'''x'''取得局部最小值,如果是负定矩阵,则函数在'''x'''取得局部最大值。在这类情况下,关于函数''f''的条件最优化问题可以转变为关于海森矩阵的[[二次规划]]问题<ref>{{Harvard citations |last1=Nocedal |year=2006 |loc=Ch. 16 |nb=yes }}</ref>。


矩阵在多元函数微积分中的另一个应用是[[雅可比矩阵]]。函数''f'': '''R'''<sup>''n''</sup> → '''R'''<sup>''m''</sup>在某一点'''x'''上的一阶偏导数存在时,可以定义它在这点上的雅可比矩阵<ref>{{Harvard citations |last1=Lang |year=1987a |nb=yes |loc=Ch. XVI.1 }}</ref>:
矩阵在多元函数微积分中的另一个应用是[[雅可比矩阵]]。函数<math>f:\mathbf{R}^n\rightarrow\mathbf{R}^m</math>在某一点'''x'''上的一阶偏导数存在时,可以定义它在这点上的雅可比矩阵<ref>{{Harvard citations |last1=Lang |year=1987a |nb=yes |loc=Ch. XVI.1 }}</ref>:
:<math>J_f(x) = \left [\frac {\partial f_i}{\partial x_j}(x) \right ]_{1 \leq i \leq m, 1 \leq j \leq n}.</math>
:<math>J_f(x) = \left [\frac {\partial f_i}{\partial x_j}(x) \right ]_{1 \leq i \leq m, 1 \leq j \leq n}</math>。如果<math>n>m</math>,而<math>J_f(x)</math>又是满秩矩阵(秩等于<math>m</math>)的话,根据[[反函数定理]],可以找到函数<math>f</math>在'''x'''附近的一个局部的反函数<ref>{{Harvard citations |last1=Lang |year=1987a |nb=yes |loc=Ch. XVI.5 }} </ref>。
如果n>m,而<math>J_f(x)</math>又是满秩矩阵(秩等于m)的话,根据[[反函数定理]],可以找到函数''f'' 在'''x'''附近的一个局部的反函数<ref>{{Harvard citations |last1=Lang |year=1987a |nb=yes |loc=Ch. XVI.5 }} </ref>。


[[偏微分方程]]理论中,二阶拟线性偏微分方程可以根据最高次偏导项系数构成的矩阵的正定性分类。假设有一个二阶拟线性偏微分方程:
[[偏微分方程]]理论中,二阶拟线性偏微分方程可以根据最高次偏导项系数构成的矩阵的正定性分类。假设有一个二阶拟线性偏微分方程:
:<math>(\mathbf{E}) \qquad \qquad \sum_{1\leqslant i, j \leqslant n} a_{ij} \frac {\partial^2 f}{\partial x_i \, \partial x_j} + \sum_{i=1}^n b_i \frac {\partial f}{\partial x_i} + cf = g. \qquad </math> 并假设 <math> a_{ij} =a_{ji},</math>
:<math>(\mathbf{E}) \qquad \qquad \sum_{1\leqslant i, j \leqslant n} a_{ij} \frac {\partial^2 f}{\partial x_i \, \partial x_j} + \sum_{i=1}^n b_i \frac {\partial f}{\partial x_i} + cf = g \qquad </math> 并假设<math> a_{ij} =a_{ji} </math>
记矩阵<math> \mathbf{A}=\left[ a_{ij} \right]_{1 \leqslant i , j \leqslant n} </math>。如果矩阵'''A'''是正定或负定矩阵,那么就称方程('''E''')为椭圆形偏微分方程;如果'''A'''不可逆,就称('''E''')为抛物形偏微分方程,如果'''A'''可逆而且恰有''n'' - 1个特征值同号,就称('''E''')为双曲型偏微分方程。其它情况下也称('''E''')为超双曲形偏微分方程。不同类型的方程解的形式也不一样<ref>{{Harvard citations |last1=Gilbarg |last2=Trudinger |year=2001 |nb=yes }}</ref>。


记矩阵<math> \mathbf{A}=\left[ a_{ij} \right]_{1 \leqslant i , j \leqslant n} </math>。如果矩阵<math>\mathbf{A}</math>是正定或负定矩阵,那么就称方程<math>(\mathbf{E})</math>为椭圆形偏微分方程;如果<math>\mathbf{A}</math>不可逆,就称<math>(\mathbf{E})</math>为抛物形偏微分方程,如果<math>\mathbf{A}</math>可逆而且恰有<math>n-1</math>个特征值同号,就称<math>(\mathbf{E})</math>为双曲型偏微分方程。其它情况下也称<math>(\mathbf{E})</math>为超双曲形偏微分方程。不同类型的方程解的形式也不一样<ref>{{Harvard citations |last1=Gilbarg |last2=Trudinger |year=2001 |nb=yes }}</ref>。
用数值方法解偏微分方程时更需要用到矩阵。一个重要的方法是[[有限元方法]],在求解各种物理中遇到的偏微分方程时广泛使用。有限元方法的基本思想是用一系列“简单”函数的线性组合来“逼近”偏微分方程的精确解。这些“简单”函数通常是指将求解区域分割成一定数量的“小块”后,仅在某一“小块”上非零的分段线性函数。选定了网格和“简单”函数后,可以求解关于[[有限元方法|刚度矩阵]]的方程得到近似解。有限元理论中证明了在满足一定的条件下,近似解将随着网格趋于精细而弱收敛到精确解<ref>{{Harvard citations |last1=Šolin |year=2005 |nb=yes |loc=Ch. 2.5 }}</ref><ref> {{Harvard citations|last1= 伊泽尔莱斯 |year=2005 |nb=yes |loc=Ch. 8 }} </ref>。

用数值方法解偏微分方程时更需要用到矩阵。一个重要的方法是[[有限元方法]],在求解各种物理中遇到的偏微分方程时广泛使用。有限元方法的基本思想是用一系列“简单”函数的线性组合来“逼近”偏微分方程的精确解。这些“简单”函数通常是指将求解区域分割成一定数量的“小块”后,仅在某一“小块”上非零的分段线性函数。选定了网格和“简单”函数后,可以求解关于[[有限元方法|刚度矩阵]]的方程得到近似解。有限元理论中证明了在满足一定的条件下,近似解将随着网格趋于精细而弱收敛到精确解<ref>{{Harvard citations |last1=Šolin |year=2005 |nb=yes |loc=Ch. 2.5 }}</ref><ref> {{Harvard citations|last1= 伊泽尔莱斯|year=2005 |nb=yes |loc=Ch. 8 }} </ref>。


===概率论与统计===
===概率论与统计===
概率论中常用到{{link-en|随机矩阵|stochastic matrix}},即-{zh-hans:行; zh-hant:列;}-向量是[[概率向量]](即所有的元素都在0和1之间,并且加起来等于1的向量)的矩阵。随机矩阵可用来定义有限概率空间中的[[马尔可夫链]]。设随机变量<math>X_n</math>是某个马尔可夫链在<math>t=n</math>时刻的状态,所有可能的状态<math>S =\left\{s_1, s_2, \cdots , s_m\right\}</math>称为状态空间,那么随机矩阵<math>M_{n}^{n+1}</math>则记录了假设已知<math>X_n</math>的可能情况下<math>X_{n+1}</math>做各种取值的可能性<ref>{{Harvard citations |last1=Latouche |last2=Ramaswami |year=1999 |nb=yes }}</ref>。<math>M_{n}^{n+1}</math>的第''i'' -{zh-hans:行; zh-hant:列;}-第''j'' -{zh-hans:列; zh-hant:行;}-上的元素表示当<math>X_n = s_j</math>的时候,<math>X_{n+1} = s_i</math>的可能性。<math>M_{n}^{n+1}</math>的第''j'' -{zh-hans:行; zh-hant:列;}-记录了从<math>X_n = s_j</math>转移到<math>X_{n+1} </math>各种状态的可能性。所以<math>M_{n}^{n+1}</math>叫做<math>t=n</math>时刻的转移矩阵。如果马尔可夫链的转移矩阵不随时刻变化,则称为齐次马尔可夫链。这时马尔可夫链的[[吸引子|吸引态]]可以通过计算转移矩阵的特征向量得到<ref>{{Harvard citations |last1=Mehata |last2=Srinivasan |year=1978 |nb=yes |loc=Ch. 2.8 }}</ref>。
概率论中常用到[[随机矩阵]],即-{zh-cn:行; zh-tw:列;}-向量是[[概率向量]](即所有的元素都在0和1之间,并且加起来等于1的向量)的矩阵。随机矩阵可用来定义有限概率空间中的[[马尔可夫链]]。设随机变量<math>X_n</math>是某个马尔可夫链在<math>t=n</math>时刻的状态,所有可能的状态<math>S =\left\{s_1, s_2, \cdots , s_m\right\}</math>称为状态空间,那么随机矩阵<math>M_{n}^{n+1}</math>则记录了假设已知<math>X_n</math>的可能情况下<math>X_{n+1}</math>做各种取值的可能性<ref>{{Harvard citations |last1=Latouche |last2=Ramaswami |year=1999 |nb=yes }}</ref>。<math>M_{n}^{n+1}</math>的第<math>i</math>-{zh-cn:行; zh-tw:列;}-第<math>j</math>-{zh-cn:列; zh-tw:行;}-上的元素表示当<math>X_n = s_j</math>的时候,<math>X_{n+1} = s_i</math>的可能性。<math>M_{n}^{n+1}</math>的第<math>j</math>-{zh-cn:行; zh-tw:列;}-记录了从<math>X_n = s_j</math>转移到<math>X_{n+1} </math>各种状态的可能性。所以<math>M_{n}^{n+1}</math>叫做<math>t=n</math>时刻的转移矩阵。如果马尔可夫链的转移矩阵不随时刻变化,则称为齐次马尔可夫链。这时马尔可夫链的[[吸引子|吸引态]]可以通过计算转移矩阵的特征向量得到<ref>{{Harvard citations |last1=Mehata |last2=Srinivasan |year=1978 |nb=yes |loc=Ch. 2.8 }}</ref>。


统计学中也会用到各种不同的矩阵。[[描述统计学]]中常常需要用矩阵的形式来描述数据样本,显得更为紧凑。几个随机变量的[[协方差矩阵]]表示它们之间的[[协方差]]关系,在某种程度上表示了它们相互间的关联程度(但不绝对)<ref>{{Harvard citations |last1=Krzanowski |year=1988 |loc=Ch. 2.2., p. 60 |nb=yes }}</ref>。
统计学中也会用到各种不同的矩阵。[[描述统计学]]中常常需要用矩阵的形式来描述数据样本,显得更为紧凑。几个随机变量的[[协方差矩阵]]表示它们之间的[[协方差]]关系,在某种程度上表示了它们相互间的关联程度(但不绝对)<ref>{{Harvard citations |last1=Krzanowski |year=1988 |loc=Ch. 2.2., p. 60 |nb=yes }}</ref>。
第495行: 第585行:
统计学中用到矩阵的另一个地方是[[线性回归]]中的[[最小二乘法]]分析。当观测到随机样本<math> (Y_i, X_{i1}, \ldots, X_{ip}), \, i = 1, \ldots, n </math>时,线性回归法的目标是希望找到以下的线性关系:
统计学中用到矩阵的另一个地方是[[线性回归]]中的[[最小二乘法]]分析。当观测到随机样本<math> (Y_i, X_{i1}, \ldots, X_{ip}), \, i = 1, \ldots, n </math>时,线性回归法的目标是希望找到以下的线性关系:
:<math> Y_i = \beta_0 + \beta_1 X_{i1} + \beta_2 X_{i2} + \ldots + \beta_p X_{ip} + \varepsilon_i, \qquad i = 1, \ldots, n </math>
:<math> Y_i = \beta_0 + \beta_1 X_{i1} + \beta_2 X_{i2} + \ldots + \beta_p X_{ip} + \varepsilon_i, \qquad i = 1, \ldots, n </math>
即将变量'''Y'''表示成'''X'''的分量的线性组合与一个已知的随机误差的和。这个表示可以写成矩阵的形式,并利用矩阵的[[奇异值分解]]来分析<ref>{{Harvard citations |last1=Krzanowski |year=1988 |loc=Ch. 4.1 |nb=yes }}</ref>。
即将变量<math>\mathbf{Y}</math>表示成<math>\mathbf{X}</math>的分量的线性组合与一个已知的随机误差的和。这个表示可以写成矩阵的形式,并利用矩阵的[[奇异值分解]]来分析<ref>{{Harvard citations |last1=Krzanowski |year=1988 |loc=Ch. 4.1 |nb=yes }}</ref>。


另一种随机矩阵({{lang|en|random matrix}})是指每个元素都是随机变量的矩阵,这些随机变量可以都遵循同一个分布,或各自遵循不同的分布。一个常见的例子是全部元素都是相互独立的标准[[正态分布]]随机变量的随机矩阵。这种随机矩阵在[[数论]]和[[物理]]中也有应用<ref>{{Harvard citations |last1=Conrey |year=2007 |nb=yes }}</ref><ref>{{Harvard citations |last1=Zabrodin |last2=Brezin |last3=Kazakov |last4=Serban |last5=Wiegmann |year=2006 |nb=yes }}</ref>。
另一种随机矩阵({{lang|en|random matrix}})是指每个元素都是随机变量的矩阵,这些随机变量可以都遵循同一个分布,或各自遵循不同的分布。一个常见的例子是全部元素都是相互独立的标准[[正态分布]]随机变量的随机矩阵。这种随机矩阵在[[数论]]和[[物理]]中也有应用<ref>{{Harvard citations |last1=Conrey |year=2007 |nb=yes }}</ref><ref>{{Harvard citations |last1=Zabrodin |last2=Brezin |last3=Kazakov |last4=Serban |last5=Wiegmann |year=2006 |nb=yes }}</ref>。
第508行: 第598行:
1925年海森堡提出第一个[[量子力学]]模型时,使用了无限维矩阵来表示理论中作用在量子态上的算子<ref>{{Harvard citations |last1=Schiff |year=1968 |nb=yes |loc=Ch. 6 }}</ref>。这种做法在[[矩阵力学]]中也能见到。例如[[密度矩阵]]就是用来刻画量子系统中“纯”[[量子态]]的线性组合表示的“混合”量子态<ref>{{Harvard citations |last1=Bohm |year=2001 |nb=yes |loc=sections II.4 and II.8 }}</ref>。
1925年海森堡提出第一个[[量子力学]]模型时,使用了无限维矩阵来表示理论中作用在量子态上的算子<ref>{{Harvard citations |last1=Schiff |year=1968 |nb=yes |loc=Ch. 6 }}</ref>。这种做法在[[矩阵力学]]中也能见到。例如[[密度矩阵]]就是用来刻画量子系统中“纯”[[量子态]]的线性组合表示的“混合”量子态<ref>{{Harvard citations |last1=Bohm |year=2001 |nb=yes |loc=sections II.4 and II.8 }}</ref>。


另一种矩阵是用来描述构成实验粒子物理基石的散射实验的重要工具。当粒子在[[粒子加速器|加速器]]中发生碰撞,原本没有相互作用的粒子在高速运动中进入其它粒子的作用区,动量改变,形成一系列新的粒子。这种碰撞可以解释为结果粒子状态和入射粒子状态线性组合的-{zh-hans:标量积; zh-hant:純量積}-。其中的线性组合可以表达为一个矩阵,称为[[S矩阵]],其中记录了所有可能的粒子间相互作用<ref>{{Harvard citations |last1=Weinberg |year=1995 |nb=yes |loc=Ch. 3 }}</ref>。
另一种矩阵是用来描述构成实验粒子物理基石的散射实验的重要工具。当粒子在[[粒子加速器|加速器]]中发生碰撞,原本没有相互作用的粒子在高速运动中进入其它粒子的作用区,动量改变,形成一系列新的粒子。这种碰撞可以解释为结果粒子状态和入射粒子状态线性组合的标量积。其中的线性组合可以表达为一个矩阵,称为[[S矩阵]],其中记录了所有可能的粒子间相互作用<ref>{{Harvard citations |last1=Weinberg |year=1995 |nb=yes |loc=Ch. 3 }}</ref>。


=== 简正模式 ===
=== 简正模式 ===
第514行: 第604行:


===幾何光學===
===幾何光學===
在[[幾何光學]]裏,可以找到很多需要用到矩陣的地方。幾何光學是一種忽略了[[波粒二象性|光波波動性]]的近似理論,這理論的模型將光線視為幾何[[射線]]。採用{{link-en|近軸近似|paraxial approximation}},假若光線與[[光軸]]之間的夾角很小,則[[透鏡]]或[[反射]]元件對於光線的作用,可以表達為2&times;2矩陣與向量的乘積。這向量的兩個分量是光線的幾何性質(光線的[[斜率]]、光線跟光軸之間在{{link-en|主平面|principal plane}}的垂直距離)。這矩陣稱為{{link-en|光線傳輸矩陣|ray transfer matrix}},內中元素編碼了光學元件的性質。對於折射,這矩陣又細分為兩種:「折射矩陣」與「平移矩陣」。折射矩陣描述光線遇到透鏡的折射行為。平移矩陣描述光線從一個主平面傳播到另一個主平面的平移行為。
在[[幾何光學]]裏,可以找到很多需要用到矩陣的地方。幾何光學是一種忽略了[[波粒二象性|光波波動性]]的近似理論,這理論的模型將光線視為幾何[[射線]]。採用[[近軸近似]],假若光線與[[光轴 (光学)|光軸]]之間的夾角很小,則[[透鏡]]或[[反射 (物理学)|反射]]元件對於光線的作用,可以表達為2×2矩陣與向量的乘積。這向量的兩個分量是光線的幾何性質(光線的[[斜率]]、光線跟光軸之間在{{link-en|主平面|principal plane}}的垂直距離)。這矩陣稱為[[光線傳輸矩陣]],內中元素編碼了光學元件的性質。對於折射,這矩陣又細分為兩種:「折射矩陣」與「平移矩陣」。折射矩陣描述光線遇到透鏡的折射行為。平移矩陣描述光線從一個主平面傳播到另一個主平面的平移行為。


由一系列[[透鏡]][[反射]]元件組成的光學系統,可以很簡單地以對應的矩陣組合來描述其光線傳播路徑。<ref>{{Harvard citations |last1=Guenther |year=1990 |nb=yes |loc=Ch. 5 }}</ref>
由一系列透鏡或反射元件組成的光學系統,可以很簡單地以對應的矩陣組合來描述其光線傳播路徑。<ref>{{Harvard citations |last1=Guenther |year=1990 |nb=yes |loc=Ch. 5 }}</ref>


===電子學===
===電子學===
在[[電子學]]裏,傳統的{{link-en|網目分析|mesh analysis}}或[[節點分析]]會獲得一個[[線性方程組]],這可以以矩陣來表示與計算。
在[[電子學]]裏,傳統的{{link-en|網目分析|mesh analysis}}或[[節點分析]]會獲得一個[[線性方程組]],這可以以矩陣來表示與計算。


很多種電子元件的電路行為可以用矩陣來描述。設定 <math>A</math> 為輸入向量,其兩個分量為輸入電壓 <math>v_1</math> 與輸入電流 <math>i_1</math> 。設定 <math>B</math> 為輸出向量,其兩個分量為輸出電壓 <math>v_2</math> 與輸出電流 <math>i_2</math> 。這電子元件的電路行為可以描述為 <math>B=H\cdot A</math> ;其中,<math>H</math> 2&times;2矩陣,內有一個[[阻抗]]元素 <math>h_{12}</math> 、一個[[導納]]元素 <math>h_{21}</math> 、兩個[[無量綱]]元素 <math>h_{11}</math> <math>h_{22}</math> 。這樣,電路的計算可以約化為矩陣計算。
很多種電子元件的電路行為可以用矩陣來描述。設定<math>A</math>為輸入向量,其兩個分量為輸入電壓<math>v_1</math>與輸入電流<math>i_1</math>。設定<math>B</math>為輸出向量,其兩個分量為輸出電壓<math>v_2</math>與輸出電流<math>i_2</math>。這電子元件的電路行為可以描述為<math>B=H\cdot A</math>;其中,<math>H</math>是2×2矩陣,內有一個[[阻抗]]元素<math>h_{12}</math>、一個[[導納]]元素<math>h_{21}</math>、兩個[[無量綱]]元素<math>h_{11}</math>與<math>h_{22}</math>。這樣,電路的計算可以約化為矩陣計算。

== 歷史 ==
作為解決線性方程的工具,矩陣也有不短的歷史。成书最迟在[[东汉]]前期的《[[九章算术]]》中,已经出现过以矩阵形式表示线性方程组系数以解方程的图例,可算作是矩阵的雏形<ref>{{Harvard citations |last1=Shen |last2=Crossley |last3=Lun |year=1999 |nb=yes }}</ref>。矩阵正式作为数学中的研究对象出现,则是在[[行列式]]的研究发展起来后。逻辑上,矩阵的概念先于行列式,但在实际的历史上则恰好相反。日本数学家[[关孝和]](1683年)与微積分的發現者之一[[戈特弗里德·威廉·萊布尼茨]](1693年)近乎同时地独立建立了[[行列式|行列式論]]。其后行列式作为解线性方程组的工具逐步发展。[[1750年]],[[加布里尔·克拉默]]发现了[[克莱姆法则]]<ref>{{Harvard citations |last1=克莱因 |year=2002 |nb=yes |loc=第33章第4节}}</ref>。

[[File:Arthur Cayley.jpg|thumb|right|180px|阿瑟·凯莱被认为是矩阵论的奠基人]]
进入十九世纪后,行列式的研究进一步发展,矩阵的概念也应运而生。[[奧古斯丁·路易·柯西]]是最早将行列式排成方阵并将其元素用双重下标表示的数学家。他还在1829年就在行列式的框架中证明了实对称矩阵特征根为实数的结论<ref>{{Harvard citations |last1=Hawkins |year=1975 |nb=yes }}</ref>。其后,[[詹姆斯·約瑟夫·西爾維斯特]]注意到,在作为行列式的计算形式以外,将数以行和列的形式作出的矩形排列本身也是值得研究的。在他希望引用数的矩形阵列而又不能用行列式来形容的时候,就用“matrix”一词来形容<ref>{{Harvard citations |last1=克莱因 |year=2002 |nb=yes |loc=第33章第4节}}</ref>。而在此之前,数学家已经开始将增广矩阵作为独立的对象引用了。西尔维斯特使用“matrix”一词是因为他希望讨论行列式的[[子式]],即将矩阵的某几行和某几列的共同元素取出来排成的矩阵的行列式,所以实际上“matrix”被他看做是生成各种子式的“母体”:
{{quote|width=70%|
我在先前的文章中将矩形排布的序列称为“Matrix”,盖因从中可以产生出各种不同的行列式,就如由同一个母体的子宫中孕育出来一样。<ref>The Collected Mathematical Papers of James Joseph Sylvester: 1837–1853, [http://books.google.com/books?id=5GQPlxWrDiEC&pg=PA247&dq=sylvester+matrix+womb&hl=en&ei=uJakTaytCoOv8gPa5cG5Dw&sa=X&oi=book_result&ct=result&resnum=8&ved=0CE8Q6AEwBw#v=onepage&q&f=false Paper 37], p. 247</ref>}}

[[阿瑟·凯莱]]被公认为矩阵论的奠基人<ref>{{Harvard citations |last1=克莱因 |year=2002 |nb=yes |loc=第33章第4节}}</ref>。他开始将矩阵作为独立的数学对象研究时,许多与矩阵有关的性质已经在行列式的研究中被发现了,这也使得凯莱认为矩阵的引进是十分自然的。他说:“我决然不是通过[[四元数]]而获得矩阵概念的;它或是直接从行列式的概念而来,或是作为一个表达线性方程组的方便方法而来的。<ref>{{Harvard citations |last1=克莱因 |year=2002 |nb=yes |loc=第33章第4节}}</ref>”他从1858年开始,发表了《矩阵论的研究报告》等一系列关于矩阵的专门论文<ref>{{Harvard citations |last1=Cayley |year=1889 |nb=yes |loc=vol. II, p. 475–496 }}</ref><ref>{{Harvard citations |editor1-last=Dieudonné |year=1978 |loc=Vol. 1, Ch. III, p. 96 |nb=yes }}</ref>,研究了矩阵的运算律、矩阵的逆以及转置和特征多项式方程。凯莱还提出了凯莱-哈密尔顿定理,并验证了3×3矩阵的情况,又说进一步的证明是不必要的。哈密尔顿证明了4×4矩阵的情况,而一般情况下的证明是弗罗贝尼乌斯于1898年给出的<ref>{{Harvard citations |last1=克莱因 |year=2002 |nb=yes |loc=第33章第4节}}</ref>。

此后更多的数学家开始对矩阵进行研究。埃尔米特证明了如果矩阵等于其复共轭转置,则特征根为实数。这种矩阵后来被称为埃尔米特矩阵<ref>{{Harvard citations |last1=克莱因 |year=2002 |nb=yes |loc=第33章第4节}}</ref>。弗罗贝尼乌斯对矩阵的特征方程、特征根、矩阵的秩、正交矩阵、矩阵方程等方面做了大量工作。1878年,在引进了不变因子、初等因子等概念的同时,弗罗贝尼乌斯给出了正交矩阵、[[相似矩阵]]和[[合同矩阵]]的概念。同年,他探讨了矩阵的最小多项式(最小方程)问题。1894年的论文中,他讨论了矩阵理论和四元数理论的关系。1896年,他给出了凯莱-哈密尔顿定理的完整证明<ref name="hist">{{Harvard citations |last1= 董可荣 |year=2007 |nb=yes |loc=第3节}}</ref>。矩阵理论在19世纪沿着两个方向发展,分别是作为抽象代数结构和作为代数工具描述几何空间的线性变换。矩阵理论为群论和不变量理论的发展。

无限维矩阵的研究始于1884年。[[庞加莱]]在两篇不严谨地使用了无限维矩阵和行列式理论的文章后开始了对这一方面的专门研究<ref name="hist"/>。1906年,希尔伯特引入无限二次型(相当于无限维矩阵)对积分方程进行研究,极大地促进了无限维矩阵的研究。在此基础上,施密茨、赫林格和特普利茨发展出算子理论,而无限维矩阵成为了研究函数空间算子的有力工具<ref name="hist"/>。


== 参见 ==
== 参见 ==
第557行: 第633行:
* {{Citation |last1=Bau III |first1=David |last2=Trefethen |first2=Lloyd N. |title=Numerical linear algebra |publisher=Society for Industrial and Applied Mathematics |location=Philadelphia, PA |isbn=978-0-89871-361-9 |year=1997 }}
* {{Citation |last1=Bau III |first1=David |last2=Trefethen |first2=Lloyd N. |title=Numerical linear algebra |publisher=Society for Industrial and Applied Mathematics |location=Philadelphia, PA |isbn=978-0-89871-361-9 |year=1997 }}
* {{Citation |last1=Bretscher |first1=Otto |title=Linear Algebra with Applications |publisher=Prentice Hall |edition=3rd |year=2005 }}
* {{Citation |last1=Bretscher |first1=Otto |title=Linear Algebra with Applications |publisher=Prentice Hall |edition=3rd |year=2005 }}
* {{Citation |last1=王萼芳 |title=高等代数教程 |publisher= 清华大学出版社 |edition=第1版 |year=1997 |isbn= 9787302024521 }}
* {{Citation |last1=王萼芳|title=高等代数教程|publisher= 清华大学出版社|edition=第1版|year=1997 |isbn= 9787302024521 }}
* {{Citation |last1=Bronson |first1=Richard |title=Schaum's outline of theory and problems of matrix operations |publisher=McGraw–Hill |location=New York |isbn=978-0-07-007978-6 |year=1989 }}
* {{Citation |last1=Bronson |first1=Richard |title=Schaum's outline of theory and problems of matrix operations |publisher=McGraw–Hill |location=New York |isbn=978-0-07-007978-6 |year=1989 }}
* {{Citation |last1=Brown |first1=William A. |title=Matrices and vector spaces |publisher=M. Dekker |location=New York, NY |isbn=978-0-8247-8419-5 |year=1991}}
* {{Citation |last1=Brown |first1=William A. |title=Matrices and vector spaces |publisher=M. Dekker |location=New York, NY |isbn=978-0-8247-8419-5 |year=1991}}
第573行: 第649行:
* {{Citation |last1=Krzanowski |first1=Wojtek J. | title=Principles of multivariate analysis |publisher=The Clarendon Press Oxford University Press |series=Oxford Statistical Science Series |isbn=978-0-19-852211-9 |mr=969370 |year=1988 |volume=3 }}
* {{Citation |last1=Krzanowski |first1=Wojtek J. | title=Principles of multivariate analysis |publisher=The Clarendon Press Oxford University Press |series=Oxford Statistical Science Series |isbn=978-0-19-852211-9 |mr=969370 |year=1988 |volume=3 }}
* {{Citation |editor1-last=Itõ |editor1-first=Kiyosi |title=Encyclopedic dictionary of mathematics. Vol. I-IV |publisher=MIT Press |edition=2nd |isbn=978-0-262-09026-1 |mr=901762 |year=1987 }}
* {{Citation |editor1-last=Itõ |editor1-first=Kiyosi |title=Encyclopedic dictionary of mathematics. Vol. I-IV |publisher=MIT Press |edition=2nd |isbn=978-0-262-09026-1 |mr=901762 |year=1987 }}
* {{Citation | title =A Course In Algebraic Number Theory | url = http://www.math.uiuc.edu/~r-ash/Ant/AntChapter2.pdf |first1= Robert B. |last1 = Ash|publisher = Dept. of Mathematics, University of Illinois }}
* {{Citation | title =A Course In Algebraic Number Theory | url =http://www.math.uiuc.edu/~r-ash/Ant/AntChapter2.pdf | first1 =Robert B. | last1 =Ash | publisher =Dept. of Mathematics, University of Illinois | accessdate =2012-04-15 | archive-date =2017-05-18 | archive-url =https://web.archive.org/web/20170518203218/http://www.math.uiuc.edu/~r-ash/Ant/AntChapter2.pdf | dead-url =no }}
* {{Citation |last1=Lang |first1=Serge |title=Analysis II |publisher=Addison-Wesley |year=1969 }}
* {{Citation |last1=Lang |first1=Serge |title=Analysis II |publisher=Addison-Wesley |year=1969 }}
* {{Citation |last1=Lang |first1=Serge |title=Calculus of several variables |publisher=Springer-Verlag |location=Berlin, DE; New York, NY |edition=3rd |isbn=978-0-387-96405-8 |year=1987a }}
* {{Citation |last1=Lang |first1=Serge |title=Calculus of several variables |publisher=Springer-Verlag |location=Berlin, DE; New York, NY |edition=3rd |isbn=978-0-387-96405-8 |year=1987a }}
第591行: 第667行:
* {{Citation |last=Wherrett |first=Brian S. |year=1987 |title=Group Theory for Atoms, Molecules and Solids |publisher=Prentice–Hall International |isbn=0-13-365461-3 }}
* {{Citation |last=Wherrett |first=Brian S. |year=1987 |title=Group Theory for Atoms, Molecules and Solids |publisher=Prentice–Hall International |isbn=0-13-365461-3 }}
* {{Citation |last1=Zabrodin |first1=Anton |last2=Brezin |first2=Édouard |last3=Kazakov |first3=Vladimir |last4=Serban |first4=Didina |last5=Wiegmann |first5=Paul |title=Applications of Random Matrices in Physics (NATO Science Series II: Mathematics, Physics and Chemistry) |publisher=Springer-Verlag |location=Berlin, DE; New York, NY |isbn=978-1-4020-4530-1 |year=2006}}
* {{Citation |last1=Zabrodin |first1=Anton |last2=Brezin |first2=Édouard |last3=Kazakov |first3=Vladimir |last4=Serban |first4=Didina |last5=Wiegmann |first5=Paul |title=Applications of Random Matrices in Physics (NATO Science Series II: Mathematics, Physics and Chemistry) |publisher=Springer-Verlag |location=Berlin, DE; New York, NY |isbn=978-1-4020-4530-1 |year=2006}}
*{{Citation| title = 与给定矩阵A的可交换子环C(A)的一些探讨 | last1 =林志兴 | last2 = 杨忠鹏 | publisher =莆田学院学报,2010年, 17(2)|year = 2010}}
*{{Citation| title = 与给定矩阵A的可交换子环C(A)的一些探讨| last1 =林志兴| last2 = 杨忠鹏| publisher =莆田学院学报,2010年, 17(2)|year = 2010}}
* {{Citation |last1=Oualline |first1=Steve |title=Practical C++ programming |publisher=[[O'Reilly Media|O'Reilly]] |isbn=978-0-596-00419-4 |year=2003 }}
* {{Citation |last1=Oualline |first1=Steve |title=Practical C++ programming |publisher=[[O'Reilly Media|O'Reilly]] |isbn=978-0-596-00419-4 |year=2003 }}
* {{Citation |last1=Press |first1=William H. |last2=Flannery |first2=Brian P. |last3=Teukolsky |first3=Saul A. |last4=Vetterling |first4=William T. |title=Numerical Recipes in FORTRAN: The Art of Scientific Computing |url=http://www.mpi-hd.mpg.de/astrophysik/HEA/internal/Numerical_Recipes/f2-3.pdf |publisher=Cambridge University Press |edition=2nd |year=1992 |chapter=LU Decomposition and Its Applications |pages=34–42 }}
* {{Citation |last1=Press |first1=William H. |last2=Flannery |first2=Brian P. |last3=Teukolsky |first3=Saul A. |last4=Vetterling |first4=William T. |title=Numerical Recipes in FORTRAN: The Art of Scientific Computing |url=http://www.mpi-hd.mpg.de/astrophysik/HEA/internal/Numerical_Recipes/f2-3.pdf |publisher=Cambridge University Press |edition=2nd |year=1992 |chapter=LU Decomposition and Its Applications |pages=34–42 |deadurl=yes |archiveurl=https://web.archive.org/web/20090906113144/http://www.mpi-hd.mpg.de/astrophysik/HEA/internal/Numerical_Recipes/f2-3.pdf |archivedate=2009-09-06 }}
* {{Citation |last1=Punnen |first1=Abraham P. |last2=Gutin |first2=Gregory |title=The traveling salesman problem and its variations |publisher=Kluwer Academic Publishers |location=Boston, MA |isbn=978-1-4020-0664-7 |year=2002 }}
* {{Citation |last1=Punnen |first1=Abraham P. |last2=Gutin |first2=Gregory |title=The traveling salesman problem and its variations |publisher=Kluwer Academic Publishers |location=Boston, MA |isbn=978-1-4020-0664-7 |year=2002 }}
* {{Citation |last1=Reichl |first1=Linda E. |title=The transition to chaos: conservative classical systems and quantum manifestations |publisher=Springer-Verlag |location=Berlin, DE; New York, NY |isbn=978-0-387-98788-0 |year=2004 }}
* {{Citation |last1=Reichl |first1=Linda E. |title=The transition to chaos: conservative classical systems and quantum manifestations |publisher=Springer-Verlag |location=Berlin, DE; New York, NY |isbn=978-0-387-98788-0 |year=2004 }}
第601行: 第677行:
* {{Citation |last1=Stoer |first1=Josef |last2=Bulirsch |first2=Roland |title=Introduction to Numerical Analysis |publisher=Springer-Verlag |location=Berlin, DE; New York, NY |edition=3rd |isbn=978-0-387-95452-3 |year=2002 }}
* {{Citation |last1=Stoer |first1=Josef |last2=Bulirsch |first2=Roland |title=Introduction to Numerical Analysis |publisher=Springer-Verlag |location=Berlin, DE; New York, NY |edition=3rd |isbn=978-0-387-95452-3 |year=2002 }}
* {{Citation |last1=Ward |first1=J. P. |title=Quaternions and Cayley numbers |publisher=Kluwer Academic Publishers Group |location=Dordrecht, NL |series=Mathematics and its Applications |isbn=978-0-7923-4513-8 |mr=1458894 |year=1997 |volume=403 }}
* {{Citation |last1=Ward |first1=J. P. |title=Quaternions and Cayley numbers |publisher=Kluwer Academic Publishers Group |location=Dordrecht, NL |series=Mathematics and its Applications |isbn=978-0-7923-4513-8 |mr=1458894 |year=1997 |volume=403 }}
* {{zh}}{{ Citation |last1= 居余马 |last2= 林翠琴|title=线性代数|publisher=清华大学出版社|year=2002|isbn=978-7-302-06507-4}}
* {{zh}}{{ Citation |last1= 居余马|last2= 林翠琴|title=线性代数|publisher=清华大学出版社|year=2002|isbn=978-7-302-06507-4}}
* {{zh}}{{ Citation |first1=莫里斯|last1=克莱因|last2= 著,张理京、张锦炎、[[江泽涵]]译|title=《古今数学思想》第三卷|publisher=上海科学技术出版社|year=2002|isbn=7-5323-6172-1}}
* {{zh}}{{ Citation |first1=莫里斯|last1=克莱因|last2= 著,张理京、张锦炎、[[江泽涵]]译|title=《古今数学思想》第三卷|publisher=上海科学技术出版社|year=2002|isbn=7-5323-6172-1}}
* {{Citation |last1=Wolfram |first1=Stephen |title=The Mathematica Book |publisher=Wolfram Media |location=Champaign, IL |edition=5th |isbn=978-1-57955-022-6 |year=2003 }}
* {{Citation |last1=Wolfram |first1=Stephen |title=The Mathematica Book |publisher=Wolfram Media |location=Champaign, IL |edition=5th |isbn=978-1-57955-022-6 |year=2003 }}
* {{Citation |last1=Thankappan |first1= V. K.|title= Quantum Mechanics |publisher= New Age International |edition=2nd |isbn= 9788122405262 |year= 1993 }}
* {{Citation |last1=Thankappan |first1= V. K.|title= Quantum Mechanics |publisher= New Age International |edition=2nd |isbn= 9788122405262 |year= 1993 }}
* {{Citation |last1= Faliva |first1= Mario |last2= Zoia |first2= Maria Grazia |title=Dynamic Model Analysis: Advanced Matrix Methods and Unit-Root Econometrics Representation Theorems|publisher=Springer-Verlag |location=Berlin, DE; New York, NY |edition=2nd |isbn= 9783540859956 |year=2008 |page=218}}
* {{Citation |last1= Faliva |first1= Mario |last2= Zoia |first2= Maria Grazia |title=Dynamic Model Analysis: Advanced Matrix Methods and Unit-Root Econometrics Representation Theorems|publisher=Springer-Verlag |location=Berlin, DE; New York, NY |edition=2nd |isbn= 9783540859956 |year=2008 |page=218}}
* {{Citation |last1=伊泽尔莱斯|first1= 刘晓艳, 刘学深 |title= 微分方程数值分析基础教程 |publisher= 清华大学出版社 |isbn= 9787302106524 |year=2005 }}
* {{Citation |last1=伊泽尔莱斯|first1= 刘晓艳刘学深译|title= 微分方程数值分析基础教程 |publisher= 清华大学出版社|isbn= 9787302106524 |year=2005 }}
* {{Citation | title=矩阵理论的历史研究 | last1= 董可荣| publisher=《山东大学》 | year=2007}}
* {{Citation | title=矩阵理论的历史研究| last1= 董可荣| publisher=《山东大学》| year=2007}}
* {{Citation |last1=Bôcher |first1=Maxime |title=Introduction to higher algebra |publisher= Dover Publications |location=New York, NY |isbn=978-0-486-49570-5 |year=2004 }}
* {{Citation |last1=Bôcher |first1=Maxime |title=Introduction to higher algebra |publisher= Dover Publications |location=New York, NY |isbn=978-0-486-49570-5 |year=2004 }}
* {{Citation |last1=Cayley |first1=Arthur |title=The collected mathematical papers of Arthur Cayley |url=http://www.hti.umich.edu/cgi/t/text/pageviewer-idx?c=umhistmath;cc=umhistmath;rgn=full%20text;idno=ABS3153.0001.001;didno=ABS3153.0001.001;view=image;seq=00000140 |publisher= Cambridge University Press |year=1889 |volume=I (1841–1853) |pages=123–126 }}
* {{Citation |last1=Cayley |first1=Arthur |title=The collected mathematical papers of Arthur Cayley |url=http://www.hti.umich.edu/cgi/t/text/pageviewer-idx?c=umhistmath;cc=umhistmath;rgn=full%20text;idno=ABS3153.0001.001;didno=ABS3153.0001.001;view=image;seq=00000140 |publisher= Cambridge University Press |year=1889 |volume=I (1841–1853) |pages=123–126 }}
第616行: 第692行:
* {{Citation |last1=Mehra |first1=Jagdish |last2=Rechenberg |first2=Helmut |title=The Historical Development of Quantum Theory |publisher= Springer-Verlag |location=Berlin, DE; New York, NY |edition=1st |isbn=978-0-387-96284-9 |year=1987 }}
* {{Citation |last1=Mehra |first1=Jagdish |last2=Rechenberg |first2=Helmut |title=The Historical Development of Quantum Theory |publisher= Springer-Verlag |location=Berlin, DE; New York, NY |edition=1st |isbn=978-0-387-96284-9 |year=1987 }}
* {{Citation |last1=Shen |first1=Kangshen |last2=Crossley |first2=John N. |last3=Lun |first3=Anthony Wah-Cheung |title=Nine Chapters of the Mathematical Art, Companion and Commentary |publisher= Oxford University Press |edition=2nd |isbn=978-0-19-853936-0 |year=1999 }}
* {{Citation |last1=Shen |first1=Kangshen |last2=Crossley |first2=John N. |last3=Lun |first3=Anthony Wah-Cheung |title=Nine Chapters of the Mathematical Art, Companion and Commentary |publisher= Oxford University Press |edition=2nd |isbn=978-0-19-853936-0 |year=1999 }}
* {{Citation |last1=Weierstrass |first1=Karl |title=Collected works |url=http://name.umdl.umich.edu/AAN8481.0003.001 |year=1915 |volume=3 }}
* {{Citation |last1=Weierstrass |first1=Karl |title=Collected works |url=http://name.umdl.umich.edu/AAN8481.0003.001 |year=1915 |volume=3 |accessdate=2012-05-06 |archive-date=2008-10-11 |archive-url=https://web.archive.org/web/20081011044057/http://name.umdl.umich.edu/AAN8481.0003.001 |dead-url=no }}
{{ReflistF}}
{{ReflistF}}


== 外部链接 ==
== 外部链接 ==
{{Wikibooks|线性代数|矩阵}}
; 百科全书
* {{springer|title=Matrix|id=p/m062780}}


; 历史
* [http://www-groups.dcs.st-and.ac.uk/~history/HistTopics/Matrices_and_determinants.html MacTutor: Matrices and determinants] {{Wayback|url=http://www-groups.dcs.st-and.ac.uk/~history/HistTopics/Matrices_and_determinants.html |date=20150308120526 }}
* [http://www.economics.soton.ac.uk/staff/aldrich/matrices.htm Matrices and Linear Algebra on the Earliest Uses Pages] {{Wayback|url=http://www.economics.soton.ac.uk/staff/aldrich/matrices.htm |date=20150708215551 }}
* [http://jeff560.tripod.com/matrices.html Earliest Uses of Symbols for Matrices and Vectors] {{Wayback|url=http://jeff560.tripod.com/matrices.html |date=20181005011838 }}

; 在线书籍
* {{Citation |last1=Kaw |first1=Autar K. |title=Introduction to Matrix Algebra |url=http://autarkaw.com/books/matrixalgebra/index.html |isbn=978-0-615-25126-4 |accessdate=2015-01-10 |archive-date=2008-08-08 |archive-url=https://web.archive.org/web/20080808091252/http://autarkaw.com/books/matrixalgebra/index.html |dead-url=no }}
* {{Citation |title=The Matrix Cookbook |url=http://orion.uwaterloo.ca/~hwolkowi/matrixcookbook.pdf |accessdate=2014-03-24 |format=PDF |archive-date=2013-12-12 |archive-url=https://web.archive.org/web/20131212175029/http://orion.uwaterloo.ca/~hwolkowi/matrixcookbook.pdf |dead-url=no }}
* {{Citation |last1=Brookes |first1=Mike |title=The Matrix Reference Manual |url=http://www.ee.ic.ac.uk/hp/staff/dmb/matrix/intro.html |publisher=[[Imperial College]] |location=London |year=2005 |accessdate=2008-12-10 |archive-date=2021-03-22 |archive-url=https://web.archive.org/web/20210322144256/http://www.ee.ic.ac.uk/hp/staff/dmb/matrix/intro.html |dead-url=no }}

; 线上矩阵计算器
* {{Citation |title=Matrix Calculator (DotNumerics) |url=http://www.dotnumerics.com/MatrixCalculator/ |access-date=2015-01-10 |archive-url=https://web.archive.org/web/20140904030009/http://www.dotnumerics.com/MatrixCalculator/ |archive-date=2014-09-04 |dead-url=yes }}
* {{Citation |last1=Xiao |first1=Gang |title=Matrix calculator |url=http://wims.unice.fr/wims/wims.cgi?module=tool/linear/matrix.en |accessdate=2008-12-10 |archive-date=2020-06-12 |archive-url=https://web.archive.org/web/20200612005713/http://wims.unice.fr/wims/wims.cgi?module=tool%2Flinear%2Fmatrix.en |dead-url=no }}
* {{Citation |title=Online matrix calculator |url=http://www.bluebit.gr/matrix-calculator/ |accessdate=2008-12-10 |archive-url=https://web.archive.org/web/20081212221215/http://www.bluebit.gr/matrix-calculator/ |archive-date=2008-12-12 |dead-url=yes }}
* {{Citation |title=Online matrix calculator (ZK framework) |url=http://matrixcalc.info/MatrixZK/ |accessdate=2009-11-26 |deadurl=yes |archiveurl=https://web.archive.org/web/20130512101418/http://matrixcalc.info/MatrixZK/ |archivedate=2013-05-12 }}
* {{Citation |title=MacAnova |url=http://www.stat.umn.edu/macanova/macanova.home.html |last1=Oehlert |first1=Gary W. |last2=Bingham |first2=Christopher |publisher=[[明尼苏达大学|University of Minnesota]], School of Statistics |accessdate=2008-12-10 |archive-date=2021-03-22 |archive-url=https://web.archive.org/web/20210322145225/http://www.stat.umn.edu/macanova/macanova.home.html |dead-url=no }}, a freeware package for matrix algebra and statistics
* {{Citation |title=Online matrix calculator |url=http://www.idomaths.com/matrix.php |accessdate=2009-12-14 |archive-date=2021-04-27 |archive-url=https://web.archive.org/web/20210427090745/https://www.idomaths.com/matrix.php |dead-url=no }}
*[http://www.elektro-energetika.cz/calculations/matreg.php?language=english Operation with matrices in R (determinant, track, inverse, adjoint, transpose)] {{Wayback|url=http://www.elektro-energetika.cz/calculations/matreg.php?language=english |date=20141015033454 }}

{{线性代数的相关概念}}
{{Authority control}}
[[Category:線性代數|J]]
[[Category:線性代數|J]]
[[Category:矩陣論|J]]
[[Category:矩陣論|J]]

{{Link FA|pl}}
{{Link GA|en}}
{{Link FA|ur}}

2024年11月21日 (四) 18:02的最新版本

线性代数
向量 · 向量空间 · 基底  · 行列式  · 矩阵
m-by-n matrix」的各地常用名稱
中国大陸列矩阵
臺灣行矩陣
「横排(row)」的各地常用名稱
中国大陸
臺灣
「纵排(column)」的各地常用名稱
中国大陸
臺灣

數學上,一個矩陣(英語:matrix)是一个有行(row)列(column)元素的矩形阵列。矩陣裡的元素可以是数字符号甚至是函数

大小相同(行数列数都相同)的矩阵之间可以相互加减,具体是对每个位置上的元素做加减法。矩阵乘法则较为复杂。两个矩阵可以相乘,当且仅当第一个矩阵的列数等于第二个矩阵的行数。矩阵乘法满足结合律分配律,但不满足交换律

矩阵的一个重要用途是解线性方程组。线性方程组中未知量的系数可以排成一个矩阵,加上常数项,则称为增广矩阵。另一个重要用途是表示线性变换,即是诸如之类的線性函數的推广。设定基底后,某个向量可以表示为的矩阵,而线性变换可以表示为列数为的矩阵,使得经过变换后得到的向量可以表示成的形式。矩阵的特征值特征向量可以揭示线性变换的深层特性。

矩陣是高等代数学中的常见工具,也常见于统计分析等应用数学学科中。在物理学中,矩阵在力学电路学光学量子物理等領域中都有应用;计算机科学中,三维动画制作也需要用到矩阵。矩阵的运算是数值分析领域的重要问题。将矩阵分解为简单矩阵的组合可以在理论和实际应用上简化矩阵的运算。对一些应用广泛而形式特殊的矩阵,例如稀疏矩阵准对角矩阵,有特定的快速运算算法。关于矩阵相关理论的发展和应用,請參考矩陣理論。在天体物理量子力学等领域,也会出现无穷维的矩阵,是矩阵的一种推广。

词源

[编辑]

中文中矩阵的概念最早见于1922年。1922年,北京师范大学附属中学數學老師程廷熙在一篇介绍文章中将矩阵译为“纵横阵”。1925年,在科学名词审查会算学名词审查组刊登於《科学》第十卷第四期的审定名词表中,矩阵被翻译为“矩阵式”,方块矩阵翻译为“方阵式”,而各类矩阵如“正交矩阵”、“伴随矩阵”中的“矩阵”则被翻译为“方阵”。1935年,中国数学会审查后,中华民国教育部审定的《数学名词》(并“通令全国各院校一律遵用,以昭划一”)中,“矩阵”作为译名首次出现。1938年,曹惠群在接受科学名词审查会委托就数学名词加以校订的《算学名词汇编》中,认为应当的译名是“长方阵”。1949年中华人民共和国成立后编订的《数学名词》中,则将译名定为“(矩)阵”。1993年,中国自然科学名词审定委员会公布的《数学名词》中,“矩阵”被定为正式译名,并沿用至今[1]

發展

[编辑]

作為解決線性方程的工具,矩陣也有不短的歷史。成书最迟在东汉前期的《九章算术》中,已经出现过以矩阵形式表示线性方程组系数以解方程的图例,可視為矩阵的雏形[2]。矩阵正式作为数学中的研究对象出现,则是在行列式的研究发展起来后。逻辑上,矩阵的概念先于行列式,但在历史上则恰好相反。日本数学家关孝和(1683年)与微積分的發現者之一戈特弗里德·威廉·萊布尼茨(1693年)近乎同时独立建立了行列式論。其后行列式作为解线性方程组的工具逐步发展。1750年,加布里尔·克拉默发现了克莱姆法则[3]

阿瑟·凯莱被认为是矩阵论的奠基人

进入十九世纪后,行列式的研究进一步发展,矩阵的概念也应运而生。奧古斯丁·路易·柯西是最早将行列式排成方阵并将其元素用双重下标表示的数学家。他还在1829年就在行列式的框架中证明了实对称矩阵特征根为实数的结论[4]。其后,詹姆斯·約瑟夫·西爾維斯特注意到,在作为行列式的计算形式以外,将数以行和列的形式作出的矩形排列本身也是值得研究的。在他希望引用数的矩形阵列而又不能用行列式来形容的时候,就用“matrix”一词来形容[3]。而在此之前,数学家已经开始将增广矩阵作为独立的对象引用了。西尔维斯特使用“matrix”一词是因为他希望讨论行列式的子式,即将矩阵的某几行和某几列的共同元素取出来排成的矩阵的行列式,所以实际上“matrix”被他看做是生成各种子式的“母体”:

我在先前的文章中将矩形排布的序列称为“Matrix”,盖因从中可以产生出各种不同的行列式,就如由同一个母体的子宫中孕育出来一样。[5]

阿瑟·凯莱被公认为矩阵论的奠基人[3]。他开始将矩阵作为独立的数学对象研究时,许多与矩阵有关的性质已经在行列式的研究中被发现,这也使得凯莱认为矩阵的引进是十分自然的。他说:“我决然不是通过四元数而获得矩阵概念的;它或是直接从行列式的概念而来,或是作为一个表达线性方程组的方便方法而来的。[3]”他从1858年开始,发表了《矩阵论的研究报告》等一系列关于矩阵的专门论文[6][7],研究了矩阵的运算律、矩阵的逆以及转置和特征多项式方程。凯莱还提出了凯莱-哈密尔顿定理,并验证了3×3矩阵的情况,又说进一步的证明是不必要的。哈密尔顿证明了4×4矩阵的情况,而一般情况下的证明是弗罗贝尼乌斯于1898年给出的[3]

此后更多数学家开始对矩阵进行研究。埃尔米特证明了如果矩阵等于其复共轭转置,则特征根为实数。这种矩阵后来被称为埃尔米特矩阵[3]。弗罗贝尼乌斯对矩阵的特征方程、特征根、矩阵的秩、正交矩阵、矩阵方程等方面做了大量工作。1878年,在引进了不变因子、初等因子等概念的同时,弗罗贝尼乌斯给出了正交矩阵、相似矩阵合同矩阵的概念。同年,他探讨了矩阵的最小多项式(最小方程)问题。1894年的论文中,他讨论了矩阵理论和四元数理论的关系。1896年,他给出了凯莱-哈密尔顿定理的完整证明[1]。矩阵理论在19世纪沿着两个方向发展,分别是作为抽象代数结构和作为代数工具描述几何空间的线性变换。矩阵理论为群论和不变量理论的发展。

无限维矩阵的研究始于1884年。庞加莱在两篇不严谨地使用了无限维矩阵和行列式理论的文章后开始了对这一方面的专门研究[1]。1906年,希尔伯特引入无限二次型(相当于无限维矩阵)对积分方程进行研究,极大地促进了无限维矩阵的研究。在此基础上,施密茨、赫林格和特普利茨发展出算子理论,而无限维矩阵成为了研究函数空间算子的有力工具[1]

正式定义

[编辑]

矩陣的定義 —  是一個集合,那函数 就會被稱為定義在 上的 矩阵

直觀上就是用兩個數碼去標記一堆數學實體(如數字、函數),實際上是有限序列的一種推廣。

被暱稱為矩陣 裡的元素,通常簡記為。除此之外也會用小寫字母 表示元素,來跟矩陣 本身做區別。但不知 的具體形式卻想強調 的元素的話,可以 表示。

如果表達式 (嚴格來說是合式公式,其中 為一個包含變數 )可以唯一決定一個矩陣 ,那会将它记成 。如:

就可以表達為

根據公理化集合论,可以定義一個函數的集合 ,它囊括所有定義在 上的 矩阵,也就是說:

行與列

[编辑]

以下的 矩陣:

一般會如下排列成為矩形來表示:

英文將橫向的元素组統称為「row」,縱向統称為「column」;但兩岸對此卻以不同的稱呼;在中國大陸,橫向的元素组称為「行」,縱向称為「列」,而在臺灣則相反,橫向称為「列」,縱向称為「行」[8]

行数是1或列数是1的矩阵又可分别称为行向量列向量,在有限的情況下,向量可用其分量表示成行数或列数是1的矩阵。

範例

[编辑]

是矩阵

的简写。要注意的是,计算机编程中,由于数组的首项是第0项,故编程者可能会将第1行/列称为第0行/列,从而对矩阵的写法产生影响,比如矩阵就要改写成

矩阵的元素可以是数字、符号或数学表达式。一般为了支援矩阵的运算,矩阵的元素之间应当能做加减法和乘法,所以是某个裡的元素。最常见的是元素属于实数域或复数域的矩阵,简称为实矩阵和复矩阵。更一般的情况下,矩阵的元素可以是由一个环中的元素排成。给定一个环,所有由中元素排成的矩陣的集合写作。若,則通常記以,称其为维矩阵或方阵


矩陣的基本運算

[编辑]

矩阵的最基本运算包括矩阵加(减)法,数乘和转置运算。被称为“矩阵加法”、“数乘”和“转置”的运算不止一种[9],其中最基本最常用的定义如下:

运算 定义 例子
加(减)法 矩陣的和(差):為一个矩陣,其中每个元素是相应元素的和(差),
其中

数乘 标量与矩陣的数乘:的每个元素是的相应元素与的乘积,
转置 矩阵的转置是一个的矩阵,记为(有些书中也记为),其中的第个行向量是原矩阵的第个列向量;或者说,转置矩阵行第列的元素是原矩阵行第列的元素,

矩阵的加法运算满足交换律:[10]。矩阵的转置和数乘运算对加法满足分配律:

矩阵加法和数乘兩種運算使得成為一个维的實數線性空間。而转置和数乘运算满足类似于结合律的规律:

矩阵也有类似行列式的初等变换,即对矩阵的某些行和某些列进行三类操作:交换两行/列,将一行/列的每个元素都乘以一个固定的量,以及将一行/列的每个元素乘以一个固定的量之后加到另一行/列的相应元素上。这些操作在求其逆矩阵时有用。

矩阵乘法

[编辑]
矩阵AB相乘得到AB的示意图

两个矩阵的乘法仅当第一个矩陣的列數(column)和另一个矩阵的行數(row)相等时才能定义。如矩陣和矩陣,它們的乘積是一個矩陣,它的一个元素

其中'[11]

例如

矩阵的乘法满足结合律和对矩阵加法的分配律(左分配律和右分配律):

  • 结合律:
  • 左分配律:
  • 右分配律:

矩阵的乘法与数乘运算之间也满足类似结合律的规律;与转置之间则满足倒置的分配律。

矩阵乘法不满足交换律。一般来说,矩陣的乘积存在,但不一定存在,即使存在,大多数时候。比如下面的例子:

这一特性使得矩阵代数与常见的一些数域(有理数、实数、复数)以及环(多项式环、整数环)都不同。给定一个维的方块矩阵,与交换的所有方块矩阵构成一个环,称为的交换子环。这些矩阵也构成的一个子空间,称为的可交换空间[12]。与中所有矩阵交换的矩阵只有形如的矩阵(称为数乘矩阵)。其中的单位矩阵,也就是主对角线上的元素为1,其它元素为0的矩阵。任意矩阵乘以单位矩阵都得到自身:

除了最常见的矩阵乘法定义以外,也有一些较不常见的矩阵乘法,比如阿达马乘积克罗内克乘积[13]

线性方程组

[编辑]

矩阵乘法的一个基本应用是在线性方程组上。线性方程组是方程组的一种,它符合以下的形式:

其中的以及等等是已知的常数,而等等则是要求的未知数。运用矩阵的方式,可以将线性方程组写成一个向量方程:

其中,是由方程组里未知量的系数排成的矩陣是含有个元素的行向量,是含有个元素的行向量[14]

这个写法下,将原来的多个方程转化成一个向量方程,在已知矩阵和向量的情况下,求未知向量

线性变换

[编辑]

矩陣是线性变换的便利表達法。矩陣乘法的本质在联系到线性变换的时候最能体现,因为矩阵乘法和线性变换的合成有以下的联系: 以表示所有長度為的行向量的集合。每个的矩阵都代表了一个从射到的线性变换。反过来,对每個线性变换,都存在唯一m×n矩陣使得对所有中的元素。这个矩阵行第列上的元素是正则基向量(第j个元素是1,其余元素是0的向量)在映射后的向量的第个元素。

也就是说,从射到的线性变换构成的向量空间上存在一个到一一映射

以下是一些典型的2维实平面上的线性变换对平面向量(图形)造成的效果,以及它们对应的2维矩阵。其中每个线性变换将蓝色图形映射成绿色图形;平面的原点(0, 0)用黑点表示。

推移
幅度m=1.25.
水平鏡射变换 挤压”变换,
压缩程度r=3/2
伸縮,3/2倍 旋轉,左转30°

设有的矩陣代表线性變換,則矩陣積代表了綫性變換的复合[15],因为

矩阵的秩是指矩阵中线性无关的行/列向量的最大个数[16],同时也是矩阵对应的线性变换的像空间的维度[17]秩-零化度定理说明矩阵的列数量等于矩阵的秩与零空间维度之和[18]

方块矩阵

[编辑]

行数与列数相同的矩阵称为方块矩阵,简称方阵。所有维的方块矩阵构成一个线性空间,这个空间对矩阵乘法也是封闭的,因此也是一个代数。方阵称为可逆或非奇异的,如果存在另一个方阵,使得

成立。这时候可以证明也有成立[19],可将矩阵称为的逆矩阵[20]。一个矩阵的逆矩阵如果存在的话,就是唯一的,通常记作

矩阵的元素称为其主对角线上的元素。方块矩阵的所有主对角线元素之和称为它的,写作。尽管矩阵的乘法不满足交换律,方阵相乘时交换顺序会导致乘积变化,但它们的迹不会变,即[21]。除此以外,矩阵转置的迹等于其自身的迹,

如果一个方阵只有主对角线上的元素不是0,其它都是0,那么称其为对角矩阵。如果主对角线上方的元素都是0,那么称为下三角矩阵;反之如果主对角线下方的元素都是0,那么称为上三角矩阵。例如的时候,这些矩阵分别写作:

(对角矩阵),(下三角矩阵)和(上三角矩阵)。

行列式

[编辑]
R2裡的一个线性变换f将蓝色图形变成绿色图形,面积不变,而顺时针排布的向量x1和x2的变成了逆时针排布。对应的矩阵行列式是-1.

方块矩阵的行列式是一个将其映射到标量的函数,记作,反映了矩阵自身的一定特性。一个方阵的行列式等于0当且仅当该方阵不可逆。系数是实数的时候,二维(三维)方阵的行列式的绝对值表示单位面积(体积)的图形经过对应的线性变换后得到的图形的面积(体积),而它的正负则代表了对应的线性变换是否改变空间的定向:行列式为正说明它保持空间定向,行列式为负则说明它逆转空间定向。

2×2矩阵的行列式是

3×3矩阵的行列式由6项组成。更高维矩阵的行列式则可以使用莱布尼兹公式写出[22],或使用拉普拉斯展开由低一维的矩阵行列式递推得出[23]

两个矩阵相乘,乘积的行列式等于它们的行列式的乘积:[24]。将矩阵的一行/列乘以某个系数加到另一行/列上不改变矩阵的行列式,将矩阵的两行/列互换则使得其行列式变号[25]。用这两种操作可以将矩阵变成一个上三角矩阵或下三角矩阵,而后两种矩阵的行列式就是主对角线上元素的乘积,因此能方便地计算。运用行列式可以计算线性方程组的解(见克萊姆法則[26]

特征值与特征向量

[编辑]

的方块矩阵的一个特征值和对应特征向量是满足

[27]的标量以及非零向量。特征值和特征向量的概念对研究线性变换很有帮助。一个线性变换可以通过它对应的矩阵在向量上的作用来可视化。一般来说,一个向量在经过映射之后可以变为任何可能的向量,而特征向量具有更好的性质[28]。假设在给定的基底下,一个线性变换对应着某个矩阵,如果一个向量可以写成矩阵的几个特征向量的线性组合:

其中的表示此向量对应的特征值是,那么向量经过线性变换后会变成:

可以清楚地知道变换后向量的结构。

另一个等价的特征值定义是:标量为特征值,如果矩阵是不可逆矩阵。根据不可逆矩阵的性质,这个定义也可以用行列式方程描述:为特征值,如果

[29]这个定义中的行列式可以展开成一个关于n多项式,叫做矩阵A特征多项式,记为。特征多项式是一个首一多项式(最高次项系数是1的多项式)。它的根就是矩阵特征值[30]哈密尔顿-凯莱定理说明,如果用矩阵本身代替多项式中的不定元,那么多项式的值是零矩阵[31]

对称

[编辑]

转置等于自己的矩阵,即满足的方块矩阵叫做对称矩阵。满足的矩阵称为反对称矩阵。在复系数矩阵中,则有埃尔米特矩阵的概念:满足的方块矩阵称为埃尔米特矩阵,其中的表示共轭转置矩阵。

根据谱定理,实对称矩阵和复埃尔米特矩阵拥有特征基,即由矩阵的特征向量组成的基底。因此任何向量都能表示成矩阵特征向量的线性组合。此外,这两类矩阵的特征值都是实数[32]

正定性

[编辑]
矩阵表达式
正定性 不定矩阵 正定矩阵
对应二次型
取值图像
说明 正定矩阵对应的二次型的取值范围永远是正的,
不定矩阵对应的二次型取值则可正可负

的实对称矩阵如果满足对所有非零向量,对应的二次型

函数值都是正数,就称为正定矩阵。类似地还有半正定矩阵、负定矩阵、不定矩阵等概念[33]。对称矩阵的正定性与其特征值密切相关。矩阵是正定的当且仅当其特征值都是正数[34]

矩阵的计算

[编辑]

矩阵在许多学科领域中都有应用,在很多时候,除了需要知道矩阵的理论性质以外,还需要计算矩阵的数值。为了矩阵的计算能够足够精确与快捷,数值线性代数中专门有研究矩阵的数值计算方法[35]。与其它的数值计算一样,矩阵的数值计算注重的主要也是算法复杂度数值稳定性。矩阵的数值计算可以使用直接计算,也可以用迭代算法,例如在计算方块矩阵的特征值时,可以从一个非零向量开始,通过特定迭代方法得到一个逼近某个特征向量的向量序列[36]

测量一个算法的复杂度是指估计此算法需要的基本运算如数字的加法和乘法的次数,或者找出它的一个上界。例如按照定义计算的话,两个阶方阵的乘法需要次数字乘法计算,因为其乘积是一个阶方阵,有个元素,计算每个元素需要次数字乘法。如果使用施特拉森算法的话,可以将数字乘法的次数减低到大约[37]。此外,编程语言或环境本身对算法的复杂度也会有影响。

某些特殊类型的矩阵携带的数据量比一般矩阵要少,同时带来的信息量比一般矩阵多。一个重要的例子是稀疏矩阵,这类矩阵中绝大部分的元素是零。有关稀疏矩阵的计算,如计算稀疏矩阵的线性方程组时,可以使用一些专用于稀疏矩阵的特殊算法(比如共轭梯度法[38]),减低计算复杂度。

算法的数值稳定性是指输入值的小变化不会让计算结果产生很大偏差。例如计算矩阵的逆时,可以用以下的算法(其中表示伴随矩阵表示行列式

这个算法在的行列式接近0的时候会引起很大的舍入误差[39]。而如果使用全选主元的高斯消去法求逆,则在复杂度降低的同时能够避免舍入误差,保证数值稳定性。

矩阵分解

[编辑]

矩阵研究的一大方向是将一般的矩阵用一些比较“简单”的矩阵来表示。这种表示方式称为矩阵的变换与分解。矩阵变换与分解的方法有很多,它们的目的都是希望化简后的矩阵保持原矩阵的某些性质,比如行列式、秩或逆矩阵,而形式相对简单,因而能用容易地进行讨论和计算,或者能使得某些算法更易执行。

LU分解将矩阵分解为一个下三角矩阵和一个上三角矩阵的乘积[40]。分解后的矩阵可以方便某些问题的解决。例如解线性方程组时,如果将系数矩阵分解成的形式,那么方程的求解可以分解为求解两步,而后两个方程可以十分简洁地求解(详见三角矩阵中“向前与向后替换”一节)。又例如在求矩阵的行列式时,如果直接计算一个矩阵的行列式,需要计算大约次加法和乘法;而如果先对矩阵做分解,再求行列式,就只需要大约次加法和乘法,大大降低了计算次数。这是因为做分解的复杂度大约是次,而后注意到是三角矩阵,所以求它们的行列式只需要将主对角线上元素相乘即可。

若尔当矩阵,其中灰色框内的是若尔当块

高斯消去法也是一种矩阵分解方法。通过初等变换操作,可以将任何矩阵变为阶梯形矩阵,而每个操作可以看做是将矩阵乘上一个特定的初等矩阵[41]奇异值分解则是另一种分解方法,将一个矩阵表示成3个矩阵的乘积:。其中酉矩阵对角矩阵

特征分解是将一个矩阵写成的形式,其中是一个可逆矩阵,是对角矩阵[42]。如果的特征分解存在,就称它是可对角化的矩阵。不能对角化的矩阵,也有类似的分解方式。任意的矩阵都可以写成的形式,其中的矩阵若尔当标准型。若尔当标准型是矩阵的一种,它与对角矩阵类似,只不过主对角线上的元素不是数值,而是若尔当块:主对角线上为同一元素,主对角线右上一行的次对角线上都是1,其它元素都是0的矩阵(见右图)[43]。特征分解可以方便计算矩阵的幂次和多项式,如要计算

而其中对角矩阵的幂次要比容易计算得多。同理还可计算矩阵指数(在线性微分方程中有应用)、矩阵对数矩阵的平方根[44]。为了提高算法的数值稳定性,还有舒尔分解等矩阵分解方法[45]

矩阵的推广

[编辑]

矩阵的元素除了可以是实数和复数以外,也可以任意环或中元素。在线性代数中,矩阵的性质可以经由有限维的线性空间中的线性变换定义。更广泛的,无限维空间中的线性算子,则可以定义更广泛的无穷维矩阵。矩阵的另一种推广是张量。标量可以看成零维方式排列的数据(只有一个“点”),向量可以看成是一维方式排列的数据(若干个“点”排成的“线段”),矩阵可以看成是二维方式排列的数据(若干个“线段”排成的“矩形”),而张量的概念则包括了这几种排列方式。在张量的概念中,标量是零维张量,向量是一维张量,矩阵是二维張量,而更高维方式排列的数据方式就是高维张量[46]

一般域和环上的矩阵

[编辑]

矩阵的元素除了可以是实数和复数以外,还可以是任何能够使得矩阵的运算律成立的元素。首先,矩阵的元素可以是任意一个域(即能够进行“加减乘除”运算的集合)中元素。例如编码理论中会出现系数为有限域中元素的矩阵,以及有理数系数的矩阵。如果矩阵的系数所在域不是代数闭域,那么在求矩阵的特征值时,由于特征值是相应的特征多项式的根,可能不在系数域中,而是在系数域的某个扩域L中。反过来,如果考虑扩域,以及中的一个元素,以及中线性变换,那么由于也是一个-线性变换,它可以表示成一个系数矩阵,其中的是扩域的阶数。是这个矩阵的特征值,这个矩阵的特征多项式中的最小多项式的幂次:

。其中的是扩域 的阶数[47]

更一般的情况是矩阵的元素属于某个环[48]。环是比域更广泛的概念,只要求其中元素能够进行加减法和乘法运算(不一定能定义除法)。给定一个环中的矩阵之间可以相互加减以及相乘,所以关于矩阵的加法和乘法也构成一个环,称为矩阵环维方阵的环與左-自同態同構[49]

交换环,則是一个帶單位元-代數,满足结合律,但不满足交换律。其中的矩阵仍然可以用莱布尼兹公式定義行列式。一个矩阵可逆当且仅当其行列式为环中的可逆元(域上的矩阵可逆只需行列式不等于0)[50]

矩阵与线性变换

[编辑]

前面已经提到,所有的线性变换都对应着一个中的矩阵。更一般地,给定了基底后,任意两个有限维线性空间之间的线性映射也对应着一个矩阵。设空间的基底分别是,那么

对任意

矩阵实际上“记录”了中每个基底向量经过变换后得到的中的像在基底下的形式。要注意矩阵的内容取决于基底的选择。可以说,矩阵是线性变换f在特定“角度”(基底)下的“素描”。不同的“角度”下,描述的矩阵是不同的,但这些矩阵都是相似矩阵[51]。与矩阵有关的基本概念都可以用线性变换的层面来解释,比如一个矩阵的转置可以用f对偶变换来表示[52]

当矩阵的元素是带单位元的环中的元素时,-矩阵对应的则是-自由模之间的-线性变换。的时候,这些-线性变换可以相互复合,因此维的-矩阵环能够与-自同态环同构。

矩阵群

[编辑]

是比环更宽泛的代数结构,只需要集合配备一个满足结合律的二元运算,即将两个群内元素映射到群内一元素的运算。矩阵群是指矩阵关于矩阵乘法组成的群[53]。显然,只有方块矩阵才能构成乘法群。所有维的可逆方阵构成一个群,称为一般线性群。由于群内每个元素都必须是可逆的,任意的矩阵群都必然是一般线性群的子群

能够在矩阵乘法和求逆矩阵运算下保持的性质都可以用来刻画一定的矩阵群。例如所有行列式为1的矩阵可以构成一个群,称为特殊线性群[54]。所有维的正交矩阵,即满足:

的矩阵也构成一个群,称为正交群[55]。正交矩阵得名于它在中对应的线性变换具有保角性,也就是说对基本的点积,满足

[56]

每个有限群都同构于一个矩阵群。实际上,每个有限群都同构于某个置换群的子群,而每个置换群都同构于一个矩阵群(见置换群的正则群表示[57])鉴于矩阵群的性质可以通过与矩阵相关的更多手段更好地理解,常常通过研究矩阵群来研究一个有限群。相关的理论称为群表示论

无限维矩阵

[编辑]

无穷维矩阵可以指行数或列数无穷大,或两者都是无穷大的矩阵[58]。尽管这样的矩阵无法完整写出,但只要知道每行每列的元素的值,仍然可以对它进行矩阵操作和运算。这里矩阵的行数和列数甚至不一定需要是可数集。需要注意的是,无穷维矩阵的乘法涉及到无穷级数求和,因此只有在相关的无穷级数收敛的时候,才能定义矩阵的乘积[59]。无限维矩阵也可以是方块矩阵,定义为行标记集合与列标记集合相同的矩阵(如[60]

无限矩阵无法定义通常意义上的行列式,因此可逆矩阵不一定是方块矩阵,同理,酉矩阵也不一定要是方块矩阵[61]

空矩阵

[编辑]

空矩阵是指行数或列数为零的矩阵。[62][63]空矩阵的定义可以完善一些关于零维空间的约定。包括约定一个矩阵与空矩阵相乘得到的也是空矩阵,两个的空矩阵相乘是一个零矩阵(所有元素都是零的矩阵)。0×0的空矩阵的行列式约定为1,所以它也可以有逆矩阵,约定为它自己[64]

分塊矩陣

[编辑]

分塊矩陣是指一個大矩陣分割成“矩陣的矩陣”。舉例,以下的矩陣

可分割成4個2×2的矩陣

。将矩阵分块可以使得矩阵结构清晰,在某些时候可以方便运算、证明。两个大小相同、分块方式也相同的矩阵可以相加。行和列的块数符合矩阵乘法要求时,分块矩阵也可以相乘。将矩阵分块相乘的结果与直接相乘是一样的。用分块矩阵求逆,可以将高阶矩阵的求逆转化为多次低阶矩阵的求逆[65]

应用

[编辑]

矩阵在许多领域都应用广泛。有些时候用到矩阵是因为其表达方式紧凑,例如在博弈论经济学中,会用收益矩阵来表示两个博弈对象在各种决策方式下的收益[66]文本挖掘索引典汇编的时候,比如在TF-IDF方法中,也会用到文件项矩阵来追踪特定词汇在多个文件中的出现频率[67]

复数可以用实系数的2×2矩阵表示:

这种表示法与复数的加减法、乘法都相兼容。比如,2×2的旋转矩阵可以用来表示模长为1的复数,一个向量乘以此旋转矩阵可以视作一个复数乘以该模长为1的复数。对四元数也有类似的矩阵表达[68]

早期的密码技术如希尔密码也用到矩阵。然而,矩阵的线性性质使这类密码相对容易破解[69]计算机图像处理也会用到矩阵来表示处理对象,并且用放射旋转矩阵来计算对象的变换,实现三维对象在特定二维屏幕上的投影[70]多项式环上的矩阵在控制论中有重要作用。

化学中也有矩阵的应用,特别在使用量子理论讨论分子键光谱的时候。具体例子有解罗特汉方程时用重叠矩阵福柯矩阵来得到哈特里-福克方法中的分子轨道

图论

[编辑]
一个无向图的邻接矩阵

图论中可以用矩阵描述一个有限图[71]。这个矩阵叫做相关矩阵的邻接矩阵,记录了图的每两个顶点之间是否有边连接。对简单图来说,邻接矩阵的元素只取两个值:0和1,第行第列上取值为0,表示没有从第个顶点连到第个顶点的边,取值为1则说明有。如果是一般情况的话,第行第 列上的取值是从第个顶点连到第j顶点的边的数目。距离矩阵则是表示图中各顶点之间距离的矩阵[72]。在研究互联网等复杂网络的时候,邻接矩阵常常会是稀疏矩阵。因此网络理论中有专门研究稀疏矩阵的方面。

数学分析

[编辑]

在多元函数微积分学中,对二阶偏导数存在的函数,可以定义其海森矩阵[73]

时,海森矩阵的特征值一正一负,说明函数处有一个鞍点(红色点)

严格来说,仅当函数在某一点上的二阶偏导数存在,才能定义这一点上的海森矩阵。海森矩阵给出了函数在这一点的变化率方面的信息。当给定的点是函数平稳点(即函数在这一点上的一阶偏导数都是0)时,就需要利用海森矩阵来查看函数在这一点周围的增长特性。多元函数在点泰勒展开是:

如果函数在点x的一阶偏导数都是0,那么,所以函数在x附近的变化率取决于海森矩阵的性质。如果是正定矩阵,那么函数在点x取得局部最小值,如果是负定矩阵,则函数在x取得局部最大值。在这类情况下,关于函数f的条件最优化问题可以转变为关于海森矩阵的二次规划问题[74]

矩阵在多元函数微积分中的另一个应用是雅可比矩阵。函数在某一点x上的一阶偏导数存在时,可以定义它在这点上的雅可比矩阵[75]

。如果,而又是满秩矩阵(秩等于)的话,根据反函数定理,可以找到函数x附近的一个局部的反函数[76]

偏微分方程理论中,二阶拟线性偏微分方程可以根据最高次偏导项系数构成的矩阵的正定性分类。假设有一个二阶拟线性偏微分方程:

并假设

记矩阵。如果矩阵是正定或负定矩阵,那么就称方程为椭圆形偏微分方程;如果不可逆,就称为抛物形偏微分方程,如果可逆而且恰有个特征值同号,就称为双曲型偏微分方程。其它情况下也称为超双曲形偏微分方程。不同类型的方程解的形式也不一样[77]

用数值方法解偏微分方程时更需要用到矩阵。一个重要的方法是有限元方法,在求解各种物理中遇到的偏微分方程时广泛使用。有限元方法的基本思想是用一系列“简单”函数的线性组合来“逼近”偏微分方程的精确解。这些“简单”函数通常是指将求解区域分割成一定数量的“小块”后,仅在某一“小块”上非零的分段线性函数。选定了网格和“简单”函数后,可以求解关于刚度矩阵的方程得到近似解。有限元理论中证明了在满足一定的条件下,近似解将随着网格趋于精细而弱收敛到精确解[78][79]

概率论与统计

[编辑]

概率论中常用到随机矩阵,即行向量是概率向量(即所有的元素都在0和1之间,并且加起来等于1的向量)的矩阵。随机矩阵可用来定义有限概率空间中的马尔可夫链。设随机变量是某个马尔可夫链在时刻的状态,所有可能的状态称为状态空间,那么随机矩阵则记录了假设已知的可能情况下做各种取值的可能性[80]的第行第列上的元素表示当的时候,的可能性。的第行记录了从转移到各种状态的可能性。所以叫做时刻的转移矩阵。如果马尔可夫链的转移矩阵不随时刻变化,则称为齐次马尔可夫链。这时马尔可夫链的吸引态可以通过计算转移矩阵的特征向量得到[81]

统计学中也会用到各种不同的矩阵。描述统计学中常常需要用矩阵的形式来描述数据样本,显得更为紧凑。几个随机变量的协方差矩阵表示它们之间的协方差关系,在某种程度上表示了它们相互间的关联程度(但不绝对)[82]

统计学中用到矩阵的另一个地方是线性回归中的最小二乘法分析。当观测到随机样本时,线性回归法的目标是希望找到以下的线性关系:

即将变量表示成的分量的线性组合与一个已知的随机误差的和。这个表示可以写成矩阵的形式,并利用矩阵的奇异值分解来分析[83]

另一种随机矩阵(random matrix)是指每个元素都是随机变量的矩阵,这些随机变量可以都遵循同一个分布,或各自遵循不同的分布。一个常见的例子是全部元素都是相互独立的标准正态分布随机变量的随机矩阵。这种随机矩阵在数论物理中也有应用[84][85]

物理学上的对称性及线性变换

[编辑]

线性变换及其所对应的对称,在现代物理学中有着重要的角色。例如,在量子场论中,基本粒子是由狭义相对论的洛伦兹群所表示,具体来说,即它们在旋量群下的表现。内含泡利矩阵及更通用的狄拉克矩阵的具体表示,在费米子的物理描述中,是一项不可或缺的构成部分,而费米子的表现可以用旋量来表述[86]。描述最轻的三种夸克时,需要用到一种内含特殊酉群SU(3)的群论表示;物理学家在计算时会用一种更简便的矩阵表示,叫盖尔曼矩阵,这种矩阵也被用作SU(3)规范群,而强核力的现代描述──量子色动力学的基础正是SU(3)。还有卡比博-小林-益川矩阵(CKM矩阵):在弱相互作用中重要的基本夸克态,与指定粒子间不同质量的夸克态不一样,但两者却是成线性关系,而CKM矩阵所表达的就是这一点[87]

量子态的线性组合

[编辑]

1925年海森堡提出第一个量子力学模型时,使用了无限维矩阵来表示理论中作用在量子态上的算子[88]。这种做法在矩阵力学中也能见到。例如密度矩阵就是用来刻画量子系统中“纯”量子态的线性组合表示的“混合”量子态[89]

另一种矩阵是用来描述构成实验粒子物理基石的散射实验的重要工具。当粒子在加速器中发生碰撞,原本没有相互作用的粒子在高速运动中进入其它粒子的作用区,动量改变,形成一系列新的粒子。这种碰撞可以解释为结果粒子状态和入射粒子状态线性组合的标量积。其中的线性组合可以表达为一个矩阵,称为S矩阵,其中记录了所有可能的粒子间相互作用[90]

简正模式

[编辑]

矩阵在物理学中的另一类泛应用是描述线性耦合调和系统。这类系统的运动方程可以用矩阵的形式来表示,即用一个质量矩阵乘以一个广义速度来给出运动项,用力矩阵乘以位移向量来刻画相互作用。求系统的解的最优方法是将矩阵的特征向量求出(通过对角化等方式),称为系统的简正模式。这种求解方式在研究分子内部动力学模式时十分重要:系统内部由化学键结合的原子的振动可以表示成简正振动模式的叠加[91]。描述力学振动或电路振荡时,也需要使用简正模式求解[92]

幾何光學

[编辑]

幾何光學裏,可以找到很多需要用到矩陣的地方。幾何光學是一種忽略了光波波動性的近似理論,這理論的模型將光線視為幾何射線。採用近軸近似,假若光線與光軸之間的夾角很小,則透鏡反射元件對於光線的作用,可以表達為2×2矩陣與向量的乘積。這向量的兩個分量是光線的幾何性質(光線的斜率、光線跟光軸之間在主平面英语principal plane的垂直距離)。這矩陣稱為光線傳輸矩陣,內中元素編碼了光學元件的性質。對於折射,這矩陣又細分為兩種:「折射矩陣」與「平移矩陣」。折射矩陣描述光線遇到透鏡的折射行為。平移矩陣描述光線從一個主平面傳播到另一個主平面的平移行為。

由一系列透鏡或反射元件組成的光學系統,可以很簡單地以對應的矩陣組合來描述其光線傳播路徑。[93]

電子學

[编辑]

電子學裏,傳統的網目分析英语mesh analysis節點分析會獲得一個線性方程組,這可以以矩陣來表示與計算。

很多種電子元件的電路行為可以用矩陣來描述。設定為輸入向量,其兩個分量為輸入電壓與輸入電流。設定為輸出向量,其兩個分量為輸出電壓與輸出電流。這電子元件的電路行為可以描述為;其中,是2×2矩陣,內有一個阻抗元素、一個導納元素、兩個無量綱元素。這樣,電路的計算可以約化為矩陣計算。

参见

[编辑]

注释与参考

[编辑]

脚注

[编辑]
  1. ^ 1.0 1.1 1.2 1.3 董可荣 2007, 第3节
  2. ^ Shen, Crossley & Lun 1999
  3. ^ 3.0 3.1 3.2 3.3 3.4 3.5 克莱因 2002, 第33章第4节
  4. ^ Hawkins 1975
  5. ^ The Collected Mathematical Papers of James Joseph Sylvester: 1837–1853, Paper 37页面存档备份,存于互联网档案馆), p. 247
  6. ^ Cayley 1889, vol. II, p. 475–496
  7. ^ Dieudonné, ed. 1978, Vol. 1, Ch. III, p. 96
  8. ^ 周建華. 《矩陣》. 台湾: 中央圖書出版社. 2002. ISBN 9789576374913 (中文). 
  9. ^ Brown 1991, Definition I.2.1 (addition), Definition I.2.4 (scalar multiplication), and Definition I.2.33 (transpose)
  10. ^ Brown 1991, Theorem I.2.6
  11. ^ Brown 1991, Definition I.2.20
  12. ^ 林志兴 & 杨忠鹏 2010
  13. ^ Horn & Johnson 1985, Ch. 4 and 5
  14. ^ Brown 1991, I.2.21 and 22
  15. ^ Greub 1975, Section III.2
  16. ^ Brown 1991, Definition II.3.3
  17. ^ Greub 1975, Section III.1
  18. ^ Brown 1991, Theorem II.3.22
  19. ^ Brown 1991, Definition I.5.13
  20. ^ Brown 1991, Definition I.2.28
  21. ^ 这个结论容易从矩阵乘法的定义获得:
  22. ^ Brown 1991, Definition III.2.1
  23. ^ Mirsky 1990, Theorem 1.4.1
  24. ^ Brown 1991, Theorem III.2.12
  25. ^ Brown 1991, Corollary III.2.16
  26. ^ Brown 1991, Theorem III.3.18
  27. ^ Brown 1991, Definition III.4.1
  28. ^ Steven A. Leduc [[#CITEREFSteven A. Leduc|]], 第293页
  29. ^ Brown 1991, Definition III.4.9
  30. ^ Brown 1991, Corollary III.4.10
  31. ^ 王萼芳 1997, 4.2,定理3,第247页
  32. ^ Horn & Johnson 1985, Theorem 2.5.6
  33. ^ Horn & Johnson 1985, Chapter 7
  34. ^ Horn & Johnson 1985, Theorem 7.2.1
  35. ^ Bau III & Trefethen 1997
  36. ^ Householder 1975, Ch. 7
  37. ^ Golub & Van Loan 1996, Algorithm 1.3.1
  38. ^ Golub & Van Loan 1996, Chapters 9 and 10, esp. section 10.2
  39. ^ Golub & Van Loan 1996, Chapter 2.3
  40. ^ Press, Flannery & Teukolsky 1992
  41. ^ Stoer & Bulirsch 2002, Section 4.1
  42. ^ Horn & Johnson 1985, Theorem 2.5.4
  43. ^ Horn & Johnson 1985, Ch. 3.1, 3.2
  44. ^ Arnold & Cooke 1992, Sections 14.5, 7, 8
  45. ^ Bronson 1989, Ch. 15
  46. ^ Coburn 1955, Ch. V
  47. ^ Ash 2012, Chapter II
  48. ^ Lang 2002, Chapter XIII
  49. ^ Lang 2002, XVII.1, p. 643
  50. ^ Lang 2002, Proposition XIII.4.16
  51. ^ Greub 1975, Section III.3
  52. ^ Greub 1975, Section III.3.13
  53. ^ Baker 2003, Def. 1.30
  54. ^ Baker 2003, Theorem 1.2
  55. ^ Artin 1991, Chapter 4.5
  56. ^ Artin 1991, Theorem 4.5.13
  57. ^ Rowen 2008, Example 19.2, p. 198
  58. ^ Itõ, ed. 1987
  59. ^ Thankappan 1993
  60. ^ Thankappan 1993
  61. ^ Thankappan 1993
  62. ^ "Empty Matrix: A matrix is empty if either its row or column dimension is zero". O-Matrix v6 User Guide. (原始内容存档于2009-04-29). 
  63. ^ Matrix - MATLAB Data Structures. system.nada.kth.se. (原始内容存档于2009-12-28). A matrix having at least one dimension equal to zero is called an empty matrix 
  64. ^ Faliva & Zoia 2008
  65. ^ 居余马 2002, 2.6
  66. ^ Fudenberg & Tirole 1983, Section 1.1.1
  67. ^ Manning 1999, Section 15.3.4
  68. ^ Ward 1997, Ch. 2.8
  69. ^ Stinson 2005, Ch. 1.1.5 and 1.2.4
  70. ^ Association for Computing Machinery 1979, Ch. 7
  71. ^ Godsil & Royle 2004, Ch. 8.1
  72. ^ Punnen 2002
  73. ^ Lang 1987a, Ch. XVI.6
  74. ^ Nocedal 2006, Ch. 16
  75. ^ Lang 1987a, Ch. XVI.1
  76. ^ Lang 1987a, Ch. XVI.5
  77. ^ Gilbarg & Trudinger 2001
  78. ^ Šolin 2005, Ch. 2.5
  79. ^ 伊泽尔莱斯 2005, Ch. 8
  80. ^ Latouche & Ramaswami 1999
  81. ^ Mehata & Srinivasan 1978, Ch. 2.8
  82. ^ Krzanowski 1988, Ch. 2.2., p. 60
  83. ^ Krzanowski 1988, Ch. 4.1
  84. ^ Conrey 2007
  85. ^ Zabrodin, Brezin & Kazakov et al. 2006
  86. ^ Itzykson & Zuber 1980, Ch. 2
  87. ^ Burgess & Moore 2007, section 1.6.3. (SU(3)), section 2.4.3.2. (Kobayashi-Maskawa matrix)
  88. ^ Schiff 1968, Ch. 6
  89. ^ Bohm 2001, sections II.4 and II.8
  90. ^ Weinberg 1995, Ch. 3
  91. ^ Wherrett 1987, part II
  92. ^ Riley, Hobson & Bence 1997, 7.17
  93. ^ Guenther 1990, Ch. 5

参考文献

[编辑]
  • Arnold, Vladimir I.; Cooke, Roger, Ordinary differential equations, Berlin, DE; New York, NY: Springer-Verlag, 1992, ISBN 978-3-540-54813-3 
  • Artin, Michael, Algebra, Prentice Hall, 1991, ISBN 978-0-89871-510-1 
  • Association for Computing Machinery, Computer Graphics, Tata McGraw–Hill, 1979, ISBN 978-0-07-059376-3 
  • Baker, Andrew J., Matrix Groups: An Introduction to Lie Group Theory, Berlin, DE; New York, NY: Springer-Verlag, 2003, ISBN 978-1-85233-470-3 
  • Bau III, David; Trefethen, Lloyd N., Numerical linear algebra, Philadelphia, PA: Society for Industrial and Applied Mathematics, 1997, ISBN 978-0-89871-361-9 
  • Bretscher, Otto, Linear Algebra with Applications 3rd, Prentice Hall, 2005 
  • 王萼芳, 高等代数教程 第1版, 清华大学出版社, 1997, ISBN 9787302024521 
  • Bronson, Richard, Schaum's outline of theory and problems of matrix operations, New York: McGraw–Hill, 1989, ISBN 978-0-07-007978-6 
  • Brown, William A., Matrices and vector spaces, New York, NY: M. Dekker, 1991, ISBN 978-0-8247-8419-5 
  • Coburn, Nathaniel, Vector and tensor analysis, New York, NY: Macmillan, 1955, OCLC 1029828 
  • Conrey, J. Brian, Ranks of elliptic curves and random matrix theory, Cambridge University Press, 2007, ISBN 978-0-521-69964-8 
  • Fudenberg, Drew; Tirole, Jean, Game Theory, MIT Press, 1983 
  • Gilbarg, David; Trudinger, Neil S., Elliptic partial differential equations of second order 2nd, Berlin, DE; New York, NY: Springer-Verlag, 2001, ISBN 978-3-540-41160-4 
  • Godsil, Chris; Royle, Gordon, Algebraic Graph Theory, Graduate Texts in Mathematics 207, Berlin, DE; New York, NY: Springer-Verlag, 2004, ISBN 978-0-387-95220-8 
  • Golub, Gene H.; Van Loan, Charles F., Matrix Computations 3rd, Johns Hopkins, 1996, ISBN 978-0-8018-5414-9 
  • Greub, Werner Hildbert, Linear algebra, Graduate Texts in Mathematics, Berlin, DE; New York, NY: Springer-Verlag, 1975, ISBN 978-0-387-90110-7 
  • Guenther, Robert D., Modern Optics, John Wiley, 1990, ISBN 0-471-60538-7 
  • Halmos, Paul Richard, A Hilbert space problem book, Graduate Texts in Mathematics 19 2nd, Berlin, DE; New York, NY: Springer-Verlag, 1982, ISBN 978-0-387-90685-0, MR 0675952 
  • Horn, Roger A.; Johnson, Charles R., Matrix Analysis, Cambridge University Press, 1985, ISBN 978-0-521-38632-6 
  • Householder, Alston S., The theory of matrices in numerical analysis, New York, NY: Dover Publications, 1975, MR 0378371 
  • Krzanowski, Wojtek J., Principles of multivariate analysis, Oxford Statistical Science Series 3, The Clarendon Press Oxford University Press, 1988, ISBN 978-0-19-852211-9, MR 0969370 
  • Itõ, Kiyosi (编), Encyclopedic dictionary of mathematics. Vol. I-IV 2nd, MIT Press, 1987, ISBN 978-0-262-09026-1, MR 0901762 
  • Ash, Robert B., A Course In Algebraic Number Theory (PDF), Dept. of Mathematics, University of Illinois, [2012-04-15], (原始内容存档 (PDF)于2017-05-18) 
  • Lang, Serge, Analysis II, Addison-Wesley, 1969 
  • Lang, Serge, Calculus of several variables 3rd, Berlin, DE; New York, NY: Springer-Verlag, 1987a, ISBN 978-0-387-96405-8 
  • Lang, Serge, Linear algebra, Berlin, DE; New York, NY: Springer-Verlag, 1987b, ISBN 978-0-387-96412-6 
  • Latouche, Guy; Ramaswami, Vaidyanathan, Introduction to matrix analytic methods in stochastic modeling 1st, Philadelphia, PA: Society for Industrial and Applied Mathematics, 1999, ISBN 978-0-89871-425-8 
  • Manning, Christopher D.; Schütze, Hinrich, Foundations of statistical natural language processing, MIT Press, 1999, ISBN 978-0-262-13360-9 
  • Mehata, K. M.; Srinivasan, S. K., Stochastic processes, New York, NY: McGraw–Hill, 1978, ISBN 978-0-07-096612-3 
  • Mirsky, Leonid, An Introduction to Linear Algebra, Courier Dover Publications, 1990, ISBN 978-0-486-66434-7 
  • Nocedal, Jorge; Wright, Stephen J., Numerical Optimization 2nd, Berlin, DE; New York, NY: Springer-Verlag: 449, 2006, ISBN 978-0-387-30303-1 
  • Bohm, Arno, Quantum Mechanics: Foundations and Applications, Springer, 2001, ISBN 0-387-95330-2 
  • Burgess, Cliff; Moore, Guy, The Standard Model. A Primer, Cambridge University Press, 2007, ISBN 0-521-86036-9 
  • Guenther, Robert D., Modern Optics, John Wiley, 1990, ISBN 0-471-60538-7 
  • Itzykson, Claude; Zuber, Jean-Bernard, Quantum Field Theory, McGraw–Hill, 1980, ISBN 0-07-032071-3 
  • Riley, Kenneth F.; Hobson, Michael P.; Bence, Stephen J., Mathematical methods for physics and engineering, Cambridge University Press, 1997, ISBN 0-521-55506-X 
  • Schiff, Leonard I., Quantum Mechanics 3rd, McGraw–Hill, 1968 
  • Weinberg, Steven, The Quantum Theory of Fields. Volume I: Foundations, Cambridge University Press, 1995, ISBN 0-521-55001-7 
  • Wherrett, Brian S., Group Theory for Atoms, Molecules and Solids, Prentice–Hall International, 1987, ISBN 0-13-365461-3 
  • Zabrodin, Anton; Brezin, Édouard; Kazakov, Vladimir; Serban, Didina; Wiegmann, Paul, Applications of Random Matrices in Physics (NATO Science Series II: Mathematics, Physics and Chemistry), Berlin, DE; New York, NY: Springer-Verlag, 2006, ISBN 978-1-4020-4530-1 
  • 林志兴; 杨忠鹏, 与给定矩阵A的可交换子环C(A)的一些探讨, 莆田学院学报,2010年, 17(2), 2010 
  • Oualline, Steve, Practical C++ programming, O'Reilly, 2003, ISBN 978-0-596-00419-4 
  • Press, William H.; Flannery, Brian P.; Teukolsky, Saul A.; Vetterling, William T., LU Decomposition and Its Applications, Numerical Recipes in FORTRAN: The Art of Scientific Computing (PDF) 2nd, Cambridge University Press: 34–42, 1992, (原始内容 (PDF)存档于2009-09-06) 
  • Punnen, Abraham P.; Gutin, Gregory, The traveling salesman problem and its variations, Boston, MA: Kluwer Academic Publishers, 2002, ISBN 978-1-4020-0664-7 
  • Reichl, Linda E., The transition to chaos: conservative classical systems and quantum manifestations, Berlin, DE; New York, NY: Springer-Verlag, 2004, ISBN 978-0-387-98788-0 
  • Rowen, Louis Halle, Graduate Algebra: noncommutative view, Providence, RI: American Mathematical Society, 2008, ISBN 978-0-8218-4153-2 
  • Šolin, Pavel, Partial Differential Equations and the Finite Element Method, Wiley-Interscience, 2005, ISBN 978-0-471-76409-0 
  • Stinson, Douglas R., Cryptography, Discrete Mathematics and its Applications, Chapman & Hall/CRC, 2005, ISBN 978-1-58488-508-5 
  • Stoer, Josef; Bulirsch, Roland, Introduction to Numerical Analysis 3rd, Berlin, DE; New York, NY: Springer-Verlag, 2002, ISBN 978-0-387-95452-3 
  • Ward, J. P., Quaternions and Cayley numbers, Mathematics and its Applications 403, Dordrecht, NL: Kluwer Academic Publishers Group, 1997, ISBN 978-0-7923-4513-8, MR 1458894 
  • (中文)居余马; 林翠琴, 线性代数, 清华大学出版社, 2002, ISBN 978-7-302-06507-4 
  • (中文)克莱因, 莫里斯; 著,张理京、张锦炎、江泽涵译, 《古今数学思想》第三卷, 上海科学技术出版社, 2002, ISBN 7-5323-6172-1 
  • Wolfram, Stephen, The Mathematica Book 5th, Champaign, IL: Wolfram Media, 2003, ISBN 978-1-57955-022-6 
  • Thankappan, V. K., Quantum Mechanics 2nd, New Age International, 1993, ISBN 9788122405262 
  • Faliva, Mario; Zoia, Maria Grazia, Dynamic Model Analysis: Advanced Matrix Methods and Unit-Root Econometrics Representation Theorems 2nd, Berlin, DE; New York, NY: Springer-Verlag: 218, 2008, ISBN 9783540859956 
  • 伊泽尔莱斯, 刘晓艳,刘学深译, 微分方程数值分析基础教程, 清华大学出版社, 2005, ISBN 9787302106524 
  • 董可荣, 矩阵理论的历史研究, 《山东大学》, 2007 
  • Bôcher, Maxime, Introduction to higher algebra, New York, NY: Dover Publications, 2004, ISBN 978-0-486-49570-5 
  • Cayley, Arthur, The collected mathematical papers of Arthur Cayley, I (1841–1853), Cambridge University Press: 123–126, 1889 
  • Dieudonné, Jean (编), Abrégé d'histoire des mathématiques 1700-1900, Paris, FR: Hermann, 1978 
  • Hawkins, Thomas, Cauchy and the spectral theory of matrices, Historia Mathematica, 1975, 2: 1–29, ISSN 0315-0860, MR 0469635, doi:10.1016/0315-0860(75)90032-4 
  • Knobloch, Eberhard, From Gauss to Weierstrass: determinant theory and its historical evaluations, The intersection of history and mathematics, Science Networks Historical Studies 15, Basel, Boston, Berlin: Birkhäuser: 51–66, 1994, MR 1308079 
  • Kronecker, Leopold, Hensel, Kurt , 编, Leopold Kronecker's Werke, Teubner, 1897 
  • Mehra, Jagdish; Rechenberg, Helmut, The Historical Development of Quantum Theory 1st, Berlin, DE; New York, NY: Springer-Verlag, 1987, ISBN 978-0-387-96284-9 
  • Shen, Kangshen; Crossley, John N.; Lun, Anthony Wah-Cheung, Nine Chapters of the Mathematical Art, Companion and Commentary 2nd, Oxford University Press, 1999, ISBN 978-0-19-853936-0 
  • Weierstrass, Karl, Collected works 3, 1915 [2012-05-06], (原始内容存档于2008-10-11) 

外部链接

[编辑]
百科全书
历史
在线书籍
线上矩阵计算器