在統計學與概率論中,協方差矩陣(covariance matrix)是一個方陣,代表著任兩列隨機變量間的協方差,是協方差的直接推廣。
定義 —
設 是機率空間, 與 是定義在 上的兩列實數隨機變量序列
若二者對應的期望值分別為:
則這兩列隨機變量間的協方差矩陣為:
將之以矩形表示的話就是:
根據測度積分的線性性質,協方差矩陣還可以進一步化簡為:
以上定義所述的隨機變數序列 和 ,也可分別以用行向量 與 表示,換句話說:
-
這樣的話,對於 個定義在 上的隨機變數 所組成的矩陣 , 定義:
也就是說
那上小節定義的協方差矩陣就可以記為:
所以協方差矩陣也可對 與 來定義:
也有人把以下的 稱為協方差矩陣:
但本頁面沿用威廉·費勒的說法,把 稱為 的方差(variance of random vector),來跟 作區別。這是因為:
換句話說, 的對角線由隨機變數 的方差所組成。據此,也有人也把 稱為方差-協方差矩陣(variance–covariance matrix)。
更有人因為方差和離差的相關性,含混的將 稱為離差矩陣。
有以下的基本性質:
- 是半正定的和對稱的矩陣。
- 若 ,則有
- 若 與 是獨立的,則有
儘管共變異數矩陣很簡單,可它卻是很多領域裡的非常有力的工具。它能導出一個變換矩陣,這個矩陣能使數據完全去相關(decorrelation)。從不同的角度看,也就是說能夠找出一組最佳的基以緊湊的方式來表達數據。(完整的證明請參考瑞利商)。
這個方法在統計學中被稱為主成分分析(principal components analysis),在圖像處理中稱為Karhunen-Loève 變換(KL-變換)。
均值為的複隨機標量變量的方差定義如下(使用共軛複數):
其中複數的共軛記為。
如果 是一個複列向量,則取其共軛轉置,得到一個方陣:
其中為共軛轉置, 它對於標量也成立,因為標量的轉置還是標量。
多元正態分布的共變異數矩陣的估計的推導非常精緻. 它需要用到譜定義以及為什麼把標量看做矩陣的跡更好的原因。參見共變異數矩陣的估計。