矩阵的对角化与上三角化
我们之前已经研究了特征多项式和最小多项式的相似性,而我们又知道矩阵可对角化与其特征多项式和特征值有重大关系。 这些关系促使我们去寻找可对角化与最小多项式的关系。
可对角化与最小多项式
我们有如下命题:
矩阵可对角化当且仅当其最小多项式可分至不重复的一次项之积。
- 若矩阵$A$可对角化,则其与一个有特征值组成的对角矩阵相似: \(\newcommand{dim}{\mathrm{dim}} \newcommand{ker}{\mathrm{ker}} \newcommand{Id}{\mathrm{Id}} A \sim \begin{pmatrix} \lambda_1 & & & & & & (0) \\ & \ddots & & & & & \\ & & \lambda_1 & & & & \\ & & & \ddots & & & \\ & & & & \lambda_r & & \\ & & & & & \ddots & \\ (0) & & & & & & \lambda_r \end{pmatrix}\) 这个矩阵的最小多项式显然为$M(X) = (X - \lambda_1) \cdots (X - \lambda_r)$。 又由于最小多项式是相似不变量,从而$A$的最小多项式与它的相同,从而其最小多项式可分至不重复的一次项。
- 我们假设$M_A(X) = (X - \lambda_1) \cdots (X - \lambda_r)$,从而$M_A(A) = 0$。 根据核引理,有$E = \bigoplus_{i=1}^{r} \mathrm{Ker}(A - \lambda_i I_n)$,从而全空间可表示成特征子空间的直和,因此矩阵可对角化。
利用指数的性质,我们还能给出一个简单(但不甚严密)的证明:
这个定理有几个推论:
矩阵可对角化,当且仅当其一个零化多项式可分至不重复的一次项。
我们知道,将变换限制在不变子空间上后,其最小多项式整除原变换的最小多项式,从而如果原变换的最小多项式可分,新变换的也是可分的。
若变换$u$可对角化,那么将其限制在任何一个不变子空间$F$上,限制后的变换$u_F$仍可对角化。
可同时对角化
称一组变换$(u_i)$可同时对角化,若存在某一组基底$B$,使其中所有变换均可在此基底下对角化。 这组基底$B$称为同时对角化基底。
我们可以利用以下命题判定线性变换是否可同时对角化:
一组变换$(u_i)$可同时对角化,当且仅当其中每一个变换都可对角化且两两可交换。
- 若两个变换可同时对角化,则有$u_i = P D_i P^{-1}, \; u_j = P D_j P^{-1}$,从而 \(u_i \circ u_j = P D_i D_j P^{-1} = P D_j D_i P^{-1} = u_j \circ u_i\)
- 我们用强数学归纳法证明逆命题。
- 空间为$n = 1$维时,显然。
- 空间为$n + 1$维时,我们设该命题对小于等于$n$维的空间都成立。 若$u_i$都是位似变换,显然; 若存在$u_{i_0}$不是位似变换,则其至少有两个特征值,我们记$E = F \oplus G$,其中$F$是一个特征子空间。 由于所有变换都是可交换的,$u_{i_0}$的特征子空间都是其他变换的不变子空间。 又因为$G$为其他特征子空间的直和,从而其也是其他变换的不变子空间。 我们把所有变换都分别限制在$F$和$G$上。 此时被限制的变换仍然满足均可对角化且两两可交换。 又因为$F,G$均不是零空间,从而其维数介于1和$n$之间。 从而由归纳假设,命题得证。
上三角化
如果一个矩阵无法对角化,如何进一步化简这个矩阵? 如果无法对角化,那么退而求其次,我们可以尝试把这个矩阵上三角化。
我们称一个矩阵可以上三角化,若存在一组基使矩阵可以变成上三角矩阵。 一个矩阵可否上三角化可以由以下命题判定:
一个矩阵可上三角化,当且仅当其一个零化多项式可分成若干个一次多项式之积。
- 如果一个矩阵可上三角化,那么其一定和某个上三角矩阵相似。 这个上三角矩阵的对角线的元素就是其特征值,从而其特征多项式可分成若干个一次多项式之积。 由凯莱-哈密尔顿定理,其特征多项式一定是一个零化多项式,从而最小多项式整除特征多项式。 因此最小多项式可分成若干个一次多项式之积。(注意最小多项式和特征多项式都是相似不变量) 自然存在有零化多项式可分成若干个一次多项式之积。
- 利用数学归纳法证明逆命题。
- 空间维数$n=1$时,显然;
- $n > 1$时,我们设$P(X) = \prod (X - \beta_k)$为其一个零化多项式。 其最小多项式必然整除$P(X)$,从而也是可分的。 我们知道最小多项式的根肯定包括所有特征值,因此$P(X)$的根中也有特征值。 从而我们设其一个特征值为$\beta_1$,因此存在一特征向量$e_1$使得$Ae_1 = \beta_1 e_1$。 我们可以构造一组包含$e_1$的基底$(e_1, e_2, \dots, e_n)$,在此基底下重写原矩阵: \(B = \begin{pmatrix} \beta_1 & L \\ 0 & B^\prime \end{pmatrix}\) 我们将这个矩阵自乘$k$次,可得: \(B^k = \begin{pmatrix} \beta_1^k & (*) \\ 0 & {B^\prime}^k \end{pmatrix}\) 可以发现对对角线而言,这相当于直接取$k$次方。 从而有: \(P(B) = \begin{pmatrix} P(\beta_1) & (*) \\ 0 & P(B^\prime) \end{pmatrix} = 0\) 现在我们知道$P(X)$也是$B^\prime$的零化多项式,从而由归纳假设,命题得证。
这个定理的简单推论为:
- 一个矩阵可上三角化,当且仅当其最小多项式可分成若干个一次多项式之积。
- 所有复数域上的矩阵都可上三角化。
对于幂零方阵,我们有: 方阵是幂零的,当且仅当其可对角化为严格上三角矩阵(对角线为0)。