下一节:广义非厄米特征值问题 上一级:稳定性与准确性评估 上一节:计算所得特征值的误差界限


计算特征向量的误差界限

我们不准备详细介绍计算特征向量的可用误差界限,这些对于大型稀疏特征问题来说可能既复杂又难以理解。相反,我们将进行一个简要的实际分析,以揭示影响特征向量敏感性的关键因素。

考虑一个近似特征对 (\widetilde\lambda,\widetilde x) 对应于精确特征对 (\lambda,x)。设 A=QTQ^{\ast}A 的舒尔分解(参见第§2.5节,页码),其中 Q=[x,Q_2] 是酉矩阵,且

T=\left[\begin{array}{cc}\lambda & a^{\ast} \\ 0 & T_{22}\end{array}\right].
从残差向量 r=A \widetilde x-\widetilde\lambda\widetilde x = Q T Q^{\ast}\widetilde x-\widetilde\lambda\widetilde x,我们有
Q^{\ast} r=T Q^{\ast} \widetilde x-\widetilde\lambda Q^{\ast} \widetilde x=(T-\widetilde\lambda I)Q^{\ast} \widetilde x.
因此,上述方程的第二到最后一个分量意味着
\Vert r\Vert _2=\Vert Q^{\ast} r\Vert _2\ge\Vert(T_{22}-\widetilde\lambda I)^{-1}\Vert _2^{-1} \Vert Q_2^{\ast} \widetilde x\Vert _2,
这表明
\sin\theta(x,\widetilde x)\equiv\Vert Q_2^{\ast} \widetilde x\Vert _2\leq \frac{\Vert r\Vert _2}{\sigma_{\min}(T_{22}-\widetilde\lambda I)}. \tag{7.107}
这一不等式揭示了另一个可能导致 \sin\theta(x,\widetilde x) 增大的潜在因素。当 T_{22} 远离正规矩阵集时,这种情况会发生,此时 \Vert(T_{22}-\widetilde\lambda I)^{-1}\Vert _2,即 T_{22}-\widetilde\lambda I 的最小奇异值的倒数,可能变得非常大,尽管 A 的其他特征值都没有接近 \widetilde\lambda

对于小型稠密特征问题,\sigma_{\min}(T_{22}-\widetilde\lambda I) 可以有效估计。这在 LAPACK [12] 中是可用的。然而,对于大型稀疏特征问题,由于 T_{22} 通常不可用,估计 \sigma_{\min}(T_{22}-\widetilde\lambda I) 是不可能的。我们只能对计算特征向量的质量有一个大致的了解。

注意,\sigma_{\min}(T_{22}-\widetilde\lambda I) 大致衡量了 \lambdaT_{22} 特征值之间的分离度。我们必须说“大致”,因为

\sigma_{\min}(T_{22}-\widetilde\lambda I) \leq \min_{\mu \in \lambda(T_{22})}\vert \mu -\widetilde\lambda \vert
而上界可能是一个严重的过高估计。

如总结在 [198] 中,特征值的分离度与特征向量的敏感性有关。确实,如果 \lambda 是一个非缺陷的重复特征值,那么存在无限多个可能的特征向量基与相关的不变子空间。前面的分析仅仅表明,当特征值合并时,这种不确定性开始被感受到。众所周知,与特征值簇相关的每个单独特征向量对扰动非常敏感,因此通常无法准确计算这样的特征向量。幸运的是,对于特征值簇的情况,通常是整个相关的特征空间在实际应用中具有重要意义,并且该特征空间可以以令人满意的精度计算。详细的处理超出了本书的范围,感兴趣的读者可以参考相关文献,例如 [425]。



下一节:广义非厄米特征值问题 上一级:稳定性与准确性评估 上一节:计算所得特征值的误差界限
Susan Blackford 2000-11-20