在线性代数 中,一個n × n {\displaystyle n\times n} 的矩陣 A {\displaystyle \mathbf {A} } 的跡 (或跡數 ),是指A {\displaystyle \mathbf {A} } 的主對角線(從左上方至右下方的對角線)上各個元素的總和 ,一般記作tr ( A ) {\displaystyle \operatorname {tr} (\mathbf {A} )} 或Sp ( A ) {\displaystyle \operatorname {Sp} (\mathbf {A} )} :
线性代数 A = [ 1 2 3 4 ] {\displaystyle \mathbf {A} ={\begin{bmatrix}1&2\\3&4\end{bmatrix}}} 向量 · 向量空间 · 基底 · 行列式 · 矩阵 矩阵与行列式 矩阵 · 行列式 · 线性方程组 · 秩 · 核 · 跡 · 單位矩陣 · 初等矩阵 · 方块矩阵 · 分块矩阵 · 三角矩阵 · 非奇异方阵 · 转置矩阵 · 逆矩阵 · 对角矩阵 · 可对角化矩阵 · 对称矩阵 · 反對稱矩陣 · 正交矩阵 · 幺正矩阵 · 埃尔米特矩阵 · 反埃尔米特矩阵 · 正规矩阵 · 伴随矩阵 · 余因子矩阵 · 共轭转置 · 正定矩阵 · 幂零矩阵 · 矩阵分解 (LU分解 · 奇异值分解 · QR分解 · 极分解 · 特征分解) · 子式和余子式 · 拉普拉斯展開 · 克罗内克积
线性空间与线性变换 线性空间 · 线性变换 · 线性子空间 · 线性生成空间 · 基 · 线性映射 · 线性投影 · 線性無關 · 线性组合 · 线性泛函 · 行空间与列空间 · 对偶空间 · 正交 · 特征向量 · 最小二乘法 · 格拉姆-施密特正交化
tr ( A ) = ∑ i = 1 n A i , i = A 1 , 1 + A 2 , 2 + ⋯ + A n , n {\displaystyle \operatorname {tr} (\mathbf {A} )=\sum _{i=1}^{n}\mathbf {A} _{i,i}=\mathbf {A} _{1,1}+\mathbf {A} _{2,2}+\cdots +\mathbf {A} _{n,n}} 其中A i , j {\displaystyle \mathbf {A} _{i,j}} 代表矩陣的第i {\displaystyle i} 行j {\displaystyle j} 列上的元素的值。一個矩陣的跡是其特徵值的總和(按代數重數計算)。
跡的英文 為trace ,是來自德文 中的Spur 這個單字(與英文中的Spoor 是同源詞),在數學中,通常簡寫為「Sp」或「tr」。
例子 設有矩陣:
A = [ 3 5 1 0 9 2 7 6 4 ] {\displaystyle \mathbf {A} ={\begin{bmatrix}3&5&1\\0&9&2\\7&6&4\end{bmatrix}}}
它的跡是:
tr ( A ) = tr [ 3 5 1 0 9 2 7 6 4 ] = 3 + 9 + 4 = 16 {\displaystyle \operatorname {tr} (\mathbf {A} )=\operatorname {tr} {\begin{bmatrix}3&5&1\\0&9&2\\7&6&4\end{bmatrix}}=3+9+4=16}
性質
线性函数 給定一個環R {\displaystyle \mathbb {R} } ,跡是一個從係數在環中的n × n {\displaystyle n\times n} 矩陣的空間M n ( R ) {\displaystyle {\mathcal {M}}_{n}(\mathbb {R} )} 射到環R {\displaystyle \mathbb {R} } 之上的線性算子。也就是說,對於任兩個n × n {\displaystyle n\times n} 的矩陣A {\displaystyle \mathbf {A} } 、B {\displaystyle \mathbf {B} } 和純量r {\displaystyle r} ,都有:
t r ( A + B ) = t r ( A ) + t r ( B ) {\displaystyle \mathrm {tr} (\mathbf {A} +\mathbf {B} )=\mathrm {tr} (\mathbf {A} )+\mathrm {tr} (\mathbf {B} )} t r ( r ⋅ A ) = r ⋅ t r ( A ) {\displaystyle \mathrm {tr} (r\cdot \mathbf {A} )=r\cdot \mathrm {tr} (\mathbf {A} )} 更進一步來說,當R {\displaystyle \mathbb {R} } 是一個域時,跡數函數t r {\displaystyle \mathrm {tr} } 是n × n {\displaystyle n\times n} 矩陣的空間M n ( R ) {\displaystyle {\mathcal {M}}_{n}(\mathbb {R} )} 上的一個線性泛函。
由於一個矩陣A {\displaystyle \mathbf {A} } 的轉置矩陣A T {\displaystyle \mathbf {A} ^{T}} 的主對角線元素和原來矩陣的主對角線元素是一樣的,所以任意一個矩陣和其轉置矩陣都會有相同的跡:
t r ( A ) = t r ( A T ) {\displaystyle \mathrm {tr} (\mathbf {A} )=\mathrm {tr} \left(\mathbf {A} ^{T}\right)}
矩阵乘积的迹数 設A {\displaystyle \mathbf {A} } 是一個n × m {\displaystyle n\times m} 矩陣,B {\displaystyle \mathbf {B} } 是個m × n {\displaystyle m\times n} 矩陣,則:
t r ( A B ) = t r ( B A ) {\displaystyle \mathrm {tr} (\mathbf {AB} )=\mathrm {tr} (\mathbf {BA} )} 其中A B {\displaystyle \mathbf {AB} } 是一個n × n {\displaystyle n\times n} 矩陣,而B A {\displaystyle \mathbf {BA} } 是一個m × m {\displaystyle m\times m} 矩陣。
上述的性質可以由矩陣乘法的定義證明:
t r ( A B ) = ∑ i = 1 n ( A B ) i , i = ∑ i = 1 n ∑ j = 1 m A i , j B j , i = ∑ j = 1 m ∑ i = 1 n B j , i A i , j = ∑ j = 1 m ( B A ) j , j = t r ( B A ) {\displaystyle \mathrm {tr} (\mathbf {AB} )=\sum _{i=1}^{n}(\mathbf {AB} )_{i,i}=\sum _{i=1}^{n}\sum _{j=1}^{m}\mathbf {A} _{i,j}\mathbf {B} _{j,i}=\sum _{j=1}^{m}\sum _{i=1}^{n}\mathbf {B} _{j,i}\mathbf {A} _{i,j}=\sum _{j=1}^{m}(\mathbf {BA} )_{j,j}=\mathrm {tr} (\mathbf {BA} )} 如果A {\displaystyle \mathbf {A} } 和B {\displaystyle \mathbf {B} } 都是n × n {\displaystyle n\times n} 的方形矩陣 ,那麼它們的乘積A B {\displaystyle \mathbf {AB} } 和B A {\displaystyle \mathbf {BA} } 也會是方形矩陣。因此,利用這個結果,可以推導出:計算若干個同樣大小的方形矩陣的乘積的跡數時,可以循環 改變乘積中方形矩陣相乘的順序,而最終的結果不變。例如,有三個方形矩陣A {\displaystyle \mathbf {A} } 、B {\displaystyle \mathbf {B} } 和C {\displaystyle \mathbf {C} } ,則:
t r ( A B C ) = t r ( B C A ) = t r ( C A B ) {\displaystyle \mathrm {tr} (\mathbf {ABC} )=\mathrm {tr} (\mathbf {BCA} )=\mathrm {tr} (\mathbf {CAB} )} 但是要注意:
t r ( A B C ) ≠ t r ( A C B ) {\displaystyle \mathrm {tr} (\mathbf {ABC} )\neq \mathrm {tr} (\mathbf {ACB} )} 更一般地,乘積中的矩陣不一定要是方形矩陣,只要某一個循環改變後的乘積依然存在,那麼得到的跡數依然會和原來的跡數相同。
另外,如果A {\displaystyle \mathbf {A} } 、B {\displaystyle \mathbf {B} } 和C {\displaystyle \mathbf {C} } 是同樣大小的方陣 而且還是對稱矩陣 的話,那麼其乘積的跡数不只在循環置換下不會改變,而且在所有的置換下都不會改變:
t r ( A B C ) = t r ( B C A ) = t r ( C A B ) = t r ( A C B ) = t r ( C B A ) = t r ( B A C ) {\displaystyle \mathrm {tr} (\mathbf {ABC} )=\mathrm {tr} (\mathbf {BCA} )=\mathrm {tr} (\mathbf {CAB} )=\mathrm {tr} (\mathbf {ACB} )=\mathrm {tr} (\mathbf {CBA} )=\mathrm {tr} (\mathbf {BAC} )}
迹数的相似不变性 跡數擁有相似不變性。如果矩陣A {\displaystyle \mathbf {A} } 和B {\displaystyle \mathbf {B} } 相似的話,它們會有相同的跡。這一性質可使上面講過的循環性質來證明:
矩陣A {\displaystyle \mathbf {A} } 和B {\displaystyle \mathbf {B} } 相似也就是說存在可逆矩陣 P {\displaystyle \mathbf {P} } ,使得B = P A P − 1 {\displaystyle \mathbf {B} =\mathbf {P} \mathbf {A} \mathbf {P} ^{-1}} 因此t r ( B ) = t r ( P A P − 1 ) = t r ( P − 1 P A ) = t r ( A ) {\displaystyle \mathrm {tr} (\mathbf {B} )=\mathrm {tr} (\mathbf {P} \mathbf {A} \mathbf {P} ^{-1})=\mathrm {tr} (\mathbf {P} ^{-1}\mathbf {P} \mathbf {A} )=\mathrm {tr} (\mathbf {A} )}
矩阵迹数和特征多项式 一个n × n {\displaystyle n\times n} 的方形矩阵A {\displaystyle \mathbf {A} } 的特征多项式P A ( λ ) {\displaystyle P_{A}(\lambda )} 定义为A {\displaystyle \mathbf {A} } 减去λ {\displaystyle \lambda } 倍的单位矩阵后所得到的矩阵的行列式 :
P A ( λ ) = det ( A − λ I ) {\displaystyle P_{A}(\lambda )=\det(\mathbf {A} -\lambda \mathbf {I} )} 特征多项式是一个关于λ {\displaystyle \lambda } 的n 次多项式,它的常数项是A {\displaystyle \mathbf {A} } 的行列式的值,最高次项是( − 1 ) n λ n {\displaystyle (-1)^{n}\lambda ^{n}} ,而接下来的n-1 次项就是( − 1 ) n − 1 t r ( A ) λ n − 1 {\displaystyle (-1)^{n-1}\mathrm {tr} (\mathbf {A} )\lambda ^{n-1}} ,也就是说:
P A ( λ ) = ( − 1 ) n λ n + ( − 1 ) n − 1 t r ( A ) λ n − 1 + ⋯ + det ( A ) {\displaystyle P_{A}(\lambda )=(-1)^{n}\lambda ^{n}+(-1)^{n-1}\mathrm {tr} (\mathbf {A} )\lambda ^{n-1}+\cdots +\det(\mathbf {A} )}
矩阵迹数与特征值 当系数域是代数闭域 时(否则可以将系数域扩展到其代数闭包上来看),特征多项式P A ( λ ) {\displaystyle P_{A}(\lambda )} 有n 个根,它可以表达成:
P A ( λ ) = ( − 1 ) n ( λ − r 1 ) α 1 ( λ − r 2 ) α 2 ⋯ ( λ − r k ) α k {\displaystyle P_{A}(\lambda )=(-1)^{n}(\lambda -r_{1})^{\alpha _{1}}(\lambda -r_{2})^{\alpha _{2}}\cdots (\lambda -r_{k})^{\alpha _{k}}} 其中的r 1 , r 2 ⋯ r k {\displaystyle r_{1},r_{2}\cdots r_{k}} 是特征多项式的不同的根,而α 1 , α 2 ⋯ α k {\displaystyle \alpha _{1},\alpha _{2}\cdots \alpha _{k}} 是这些根在特征多项式裡的重数,称为代数重数。显然,所有代数重数加起来等于n 。一方面,特征多项式的根就是矩阵的特征值,而另一方面,借由根与多项式系数的关系可以知道:特征多项式的所有的根加起来等于矩阵的迹数。所以矩阵的迹数是矩阵的所有特征值(按照代数重数计算)的和。
t r ( A ) = α 1 r 1 + α 2 r 2 + ⋯ + α k r k {\displaystyle \mathrm {tr} (\mathbf {A} )=\alpha _{1}r_{1}+\alpha _{2}r_{2}+\cdots +\alpha _{k}r_{k}} 如果将矩阵写成它的若尔当标准型的话,也可以看出这一点,因为若尔当标准型的特征多项式的所有的根(包括重根)就是对角线上的所有元素。
如果不区分相同或不同的特征值的话,上述关系也可以写成:
t r ( A ) = λ 1 + λ 2 + ⋯ + λ n {\displaystyle \mathrm {tr} (\mathbf {A} )=\lambda _{1}+\lambda _{2}+\cdots +\lambda _{n}} 其中的λ 1 , λ 2 ⋯ λ n {\displaystyle \lambda _{1},\lambda _{2}\cdots \lambda _{n}} 是矩阵的特征值。 而且有:
∀ m ∈ N , t r ( A m ) = λ 1 m + λ 2 m + ⋯ + λ n m {\displaystyle \forall m\in \mathbb {N} ,\mathrm {tr} (\mathbf {A} ^{m})=\lambda _{1}^{m}+\lambda _{2}^{m}+\cdots +\lambda _{n}^{m}}
線性映射的跡數 設系数域为K {\displaystyle \mathbb {K} } 的V {\displaystyle \mathbb {V} } 是一個有限維 的向量空間 ,維數是n 。給定任一線性映射f : V → V {\displaystyle f:\mathbb {V} \rightarrow \mathbb {V} } ,可以定義此一映射的跡數為其变换矩阵的跡,即選定V {\displaystyle \mathbb {V} } 的一個基底並用對應於此基底的一個方形矩陣描述f {\displaystyle f} ,再定義這個方形矩陣的跡數為f {\displaystyle f} 的跡數。這個定義下f {\displaystyle f} 的跡數和所選取的基無關:只需要注意到不同的基底的選取實際上等價於對變換矩陣做一次相似變換,而兩個相似的矩陣的跡數是一樣的。因此這樣的定義是自洽的。
另外一种定义涉及到行列式的性质。考虑V {\displaystyle \mathbb {V} } 的一个基底B = ( e 1 , e 2 , ⋯ , e n ) {\displaystyle {\mathcal {B}}=(e_{1},e_{2},\cdots ,e_{n})} ,以及函数:
S p : V n ⟶ K , {\displaystyle Sp:\;\;\;\quad \mathbb {V} ^{n}\qquad \;\quad \longrightarrow \quad \qquad \qquad \qquad \mathbb {K} \qquad \qquad \qquad ,} S p : ( x 1 , x 2 , ⋯ , x n ) ⟼ ∑ i = 1 n det ( x 1 , x 2 , ⋯ , f ( x i ) , ⋯ , x n ) {\displaystyle Sp:(x_{1},x_{2},\cdots ,x_{n})\longmapsto \sum _{i=1}^{n}\det(x_{1},x_{2},\cdots ,f(x_{i}),\cdots ,x_{n})} 根据行列式理论,这个函数也是一个行列式型的函数,也就是说存在一个只取决于f {\displaystyle f} 的量S p ( f ) {\displaystyle \mathrm {Sp} (f)} ,使得
S p ( x 1 , x 2 , ⋯ , x n ) = S p ( f ) ⋅ det ( x 1 , x 2 , ⋯ , x n ) {\displaystyle Sp(x_{1},x_{2},\cdots ,x_{n})=\mathrm {Sp} (f)\cdot \det(x_{1},x_{2},\cdots ,x_{n})} 可以证明,这个纯量S p ( f ) {\displaystyle \mathrm {Sp} (f)} 就等于之前定义的f {\displaystyle f} 的跡數。
迹的梯度 由迹的定义可知迹可以看作是矩阵的实标量函数,所以我们可以通过求实标量函数的梯度来求迹的梯度 。
单个矩阵 A 是m×m矩阵时,有∂ t r ( A ) ∂ A = I m {\displaystyle {\frac {\partial \mathrm {tr} (\mathbf {A} )}{\partial \mathbf {A} }}={\mathbf {I} }_{m}} m×m矩阵A 可逆时,有∂ t r ( A − 1 ) ∂ A = − ( A − 2 ) T {\displaystyle {\frac {\partial \mathrm {tr} (\mathbf {A} ^{-1})}{\partial \mathbf {A} }}=-(\mathbf {A} ^{-2})^{T}} 对于两个向量x 和y 的外积,有∂ t r ( x y T ) ∂ x = ∂ t r ( y x T ) ∂ x = y {\displaystyle {\frac {\partial \mathrm {tr} ({\boldsymbol {xy}}^{T})}{\partial {\boldsymbol {x}}}}={\frac {\partial \mathrm {tr} ({\boldsymbol {yx}}^{T})}{\partial {\boldsymbol {x}}}}={\boldsymbol {y}}}
两个矩阵 若A 为m×n矩阵,有∂ t r ( A A T ) ∂ A = ∂ t r ( A T A ) ∂ A = 2 A {\displaystyle {\frac {\partial \mathrm {tr} (\mathbf {A} \mathbf {A} ^{T})}{\partial \mathbf {A} }}={\frac {\partial \mathrm {tr} (\mathbf {A} ^{T}\mathbf {A} )}{\partial \mathbf {A} }}=2\mathbf {A} } 若A 为m×m矩阵,有∂ t r ( A 2 ) ∂ A = ∂ t r ( A A ) ∂ A = 2 A T {\displaystyle {\frac {\partial \mathrm {tr} (\mathbf {A} ^{2})}{\partial \mathbf {A} }}={\frac {\partial \mathrm {tr} (\mathbf {A} \mathbf {A} )}{\partial \mathbf {A} }}=2\mathbf {A} ^{T}} 若A 为m×n矩阵,B 是m×n矩阵,有∂ t r ( A T B ) ∂ A = ∂ t r ( B A T ) ∂ A = B {\displaystyle {\frac {\partial \mathrm {tr} (\mathbf {A} ^{T}\mathbf {B} )}{\partial \mathbf {A} }}={\frac {\partial \mathrm {tr} (\mathbf {B} \mathbf {A} ^{T})}{\partial \mathbf {A} }}=\mathbf {B} } 若A 为m×n矩阵,B 是n×m矩阵,有∂ t r ( A B ) ∂ A = ∂ t r ( B A ) ∂ A = B T {\displaystyle {\frac {\partial \mathrm {tr} (\mathbf {A} \mathbf {B} )}{\partial \mathbf {A} }}={\frac {\partial \mathrm {tr} (\mathbf {B} \mathbf {A} )}{\partial \mathbf {A} }}=\mathbf {B} ^{T}} 当A 和B 均为对称矩阵时,有∂ t r ( A B ) ∂ A = ∂ t r ( B A ) ∂ A = B + B T − d i a g ( B ) {\displaystyle {\frac {\partial \mathrm {tr} (\mathbf {A} \mathbf {B} )}{\partial \mathbf {A} }}={\frac {\partial \mathrm {tr} (\mathbf {B} \mathbf {A} )}{\partial \mathbf {A} }}=\mathbf {B} +\mathbf {B} ^{T}-diag(\mathbf {B} )} 若A 和B 都是m×m矩阵,并且A 是非奇异矩阵,有∂ t r ( B A − 1 ) ∂ A = − ( A − 1 B T A − 1 ) T {\displaystyle {\frac {\partial \mathrm {tr} (\mathbf {B} \mathbf {A} ^{-1})}{\partial \mathbf {A} }}=-(\mathbf {A} ^{-1}\mathbf {B} ^{T}\mathbf {A} ^{-1})^{T}}
參見
参考来源 张贤达,《矩阵分析与应用》,第54页 张贤达,《矩阵分析与应用》,第55页 Carl Dean Meyer, Matrix Analysis and Applied Linear Algebra ,第110页 Karim M. Abadir,Jan R. Magnus, Matrix algebra ,第168页 Werner, Linear Algebra ,第126页 Werner, Linear Algebra ,第127-128页
参考书籍 (中文) 张贤达. 矩阵分析与应用. 清华大学出版社. 2008. ISBN 9787302092711. (英文) Strang Gilbert. Linear algebra and its applications. Thomson, Brooks/Cole, Belmont, CA. 2006. ISBN 9780534422004. (中文) 居余马、林翠琴. 线性代数. 清华大学出版社. 2002. ISBN 978-7-302-06507-4. (英文) Werner Hildbert Greub. linear algebra . Springer Verlag. 1975. ISBN 978-0-387-90110-7. (英文) Steven Roman. Advanced Linear Algebra . Springer. 2005. ISBN 0-387-24766-1. (英文) Carl Dean Meyer. Matrix Analysis and Applied Linear Algebra Book and Solutions Manual . Society for Industrial and Applied Mathematics. 2001. ISBN 978-0898714548. (英文) Karim M. Abadir,Jan R. Magnus. Matrix algebra . Cambridge University Press. 2005. ISBN 978-0521537469. 维基百科, wiki, wikipedia, 百科全书, 书籍, 图书馆, 文章, 阅读, 免费下载, 关于 跡 的信息, 什么是 跡?跡 是什么意思?