下一节:条件数 上一级:非厄米特征问题 上一节:等价关系(相似性)

特征分解

我们将讨论四种特征分解,或者说四种与矩阵A相似的矩阵,它们在解决特征问题时更为简便。第一种是对角形式,仅在存在n个独立特征向量时才存在。第二种是约当形式,它将对角形式推广到所有矩阵。它可能非常病态(实际上,它可能会不连续变化),因此对于数值计算,我们通常使用第三种,即舒尔形式,它在计算上更经济且更稳定。我们简要提及第四种,我们称之为约当-舒尔形式1,它与舒尔形式一样稳定,但计算了约当形式提供的关于不变子空间的一些详细信息。

定义 \Lambda = {\rm diag}(\lambda_1 ,\ldots, \lambda_n)。 如果存在n个独立的右特征向量 x_1,\ldots,x_n, 我们定义 X = [x_1,\ldots,x_n]X被称为A特征向量矩阵n个等式 A x_i = \lambda_i x_i 对于 i=1,\ldots,n 也可以写成 AX = X \LambdaA = X \Lambda X^{-1}。如下分解

A = X \Lambda X^{-1}
被称为A对角形式。注意 X^{-1}A = \Lambda X^{-1}。 令 y_i^* 表示 X^{-1} 的第i行, 我们可以看到 y_i^*A = \lambda y_i^*。换句话说, X^{-1} 的行是A的左特征向量。 因此,如果An个独立的特征向量,那么它与对角矩阵\Lambda相似。在这种情况下,我们称A可对角化的

如果我们取Xk列(例如 \hat{X}= X(:,[2,3,5]) = 第2、3和5列),这些列张成了A的一个不变子空间。 如果我们取相应的子矩阵 \hat{\Lambda}= {\rm diag}(\lambda_2 , \lambda_3 , \lambda_5)\Lambda中,以及X^{-1}的相应三行(例如 \hat{Y}^* = X^{-1}([2,3,5],:)), 我们可以写出相应的部分对角形式A \hat{X}= \hat{X}\hat{\Lambda}\hat{Y}^* A \hat{X}= \hat{\Lambda}。如果\hat{X}中的列被张成同一不变子空间的k个不同向量替换,我们得到 一个不同的部分特征分解 A \check{X}= \check{X}\check{A}, 其中\check{A}是一个kk矩阵,其特征值与\hat{\Lambda}相同,尽管 \check{A}可能不是对角的。下面讨论的其他特征分解也可以通过类似的过程产生部分特征分解。

如果所有的\lambda_i都是不同的,那么一定存在n个独立的特征向量, 对角形式存在。这是最简单和最常见的情况。 例如,如果随机选择一个矩阵2,特征值不同的概率是1。

(2.3)式中矩阵 A(0) 的对角形式不存在,因为它只有一个独立的特征向量。 相反,我们可以计算它的约当形式,它是如下分解

A = XJX^{-1},
其中J是一个块对角矩阵,即形式为 J = {\rm diag} (J_1 ,\ldots,J_e),其中每个J_i是一个被称为约当块的方阵。 每个J_i是上三角的,其单个特征值\lambda_i 在主对角线上,第一上对角线上为1。 J_i有且只有一个独立的右和左特征向量。 A(0)是一个2乘2的约当块,其单个特征值为0, 并且 A(0) + \lambda_i I 是一个2乘2的约当块,其单个特征值为\lambda_i。 可以证明,约当形式明确描述了A的所有可能不变子空间,这些子空间由X的某些列子集张成[187]。

不幸的是,约当形式通常不适用于数值计算。以下是两个原因。首先,它可能随着A的变化而不连续变化。例如,矩阵J对于A(\epsilon)\epsilon \neq 0{\rm diag}(+ \epsilon , - \epsilon),但对于A(0)J=A(0)本身。其次,特征向量矩阵X 可能非常病态,即难以准确求逆。 在A(\epsilon)的情况下,X的条件数增长为1/\epsilon

因此,我们更常用形式为

A = QTQ^*,
的特征分解,其中Q是酉(或正交)相似变换,T是三角形(或准三角形)。这被称为A舒尔形式A是复数,或实数且所有特征值都是实数时, T是三角形的,其对角线上有A的特征值。 当A是实数且有复数特征值,Q是实数且正交时, T不可能是实数和三角形的。不过,我们可以允许对角线上出现特征值为复数的2乘2块,其我们称之为准三角形形式。 为了简化陈述,我们仅考虑复数情况,此时T是三角形的。令 \lambda_1 = T_{11},\ldots,\lambda_n = T_{nn} 为对角线上出现的特征值顺序;每种顺序都对应不同的舒尔形式。 Q的列被称为舒尔向量。舒尔形式不像对角形式和约当形式那样明确给出特征向量和所有不变子空间的基,但它可以相当稳定地计算。 Q的前k列张成了特征值\lambda_1\lambda_k的不变子空间,但所有其他特征空间需要另外计算。例如,特征向量可以通过从T中解一个三角形方程组并乘以Q来计算[114]。

最后,我们考虑约当-舒尔形式。 它相当复杂,因此我们只在这里总结其性质。与舒尔形式一样,它只使用酉(正交)变换,因此可以稳定地计算。 与约当形式一样,它明确显示了约当块的大小,并为比舒尔形式更多的不变子空间提供了明确的基。

许多教科书给出了在约当形式的A的基础上计算指数矩阵e^A等问题的明确解[114]。 这些方法在数值上应避免,因为计算约当形式相当困难。 几乎所有这些问题都有基于舒尔形式或某些情况下的约当-舒尔形式的替代解决方案。


  1. 在文献中,它通常被称为阶梯形式(staircase form),但我们认为使用约当-舒尔形式更为恰当。
  2. 例如,可以从 (-1,1) 或实数的其他开区间中,独立且随机地选择每一个元素。


下一节:条件数 上一级:非厄米特征问题 上一节:等价关系(相似性)
Susan Blackford 2000-11-20