下一节:改进的投影法 上一级:基本概念 上一节:斜投影法

调和 Ritz 值

我们引入 Ritz 值与 Krylov 子空间的关系时,已经指出它们往往能更好地逼近外侧特征值而非内侧特征值。这一观点既有理论支撑,也得到了实践验证。位于谱内部区域的 Ritz 值通常被视为某些外侧特征值的不良近似,相应的 Ritz 向量在其对应特征值附近的特征向量方向上的分量往往很小。可以说,这个 Ritz 值正在向某个外侧特征值收敛。这意味着,如果对内部特征对感兴趣,对应于内部特征值的 Ritz 向量通常也不适合用于重启目的。这些重启对于内部特征对尤为必要,以避免为 VW 构建高维基底。(译者注:关于重启的概念要去后面的章节查看。)

一种有趣的斜投影方法特殊情况是选择 \mathcal{L}\mathcal{L} = A \mathcal{K}。与之前的符号约定类似,设 V\mathcal{K} 的基底。假设 A 是非奇异的,我们可以将 \mathcal{L} 的基底取为向量系统 W = A V。从子空间 \mathcal{K} 中提取的近似特征向量 \tilde{u} 可以表示为

\tilde{u} = V y,
其中 y 是一个 m 维向量。近似特征值 \tilde{\lambda} 由 Petrov-Galerkin 条件获得,即
(A V)^{\ast} (A - \tilde{\lambda} I) V y = 0
或者
V^{\ast} A^{\ast} A V y = \tilde{\lambda}V^{\ast} A^{\ast} V y.
这给出一个大小为 m 的广义特征值问题,其左侧矩阵是厄米正定的。通过要求 AV 为正交系统,可以得到一个标准的特征值问题。在这种情况下,上式变为
V^{\ast} A^{\ast} V y = W^{\ast}A^{-1} W y = \frac{1}{\tilde{\lambda}} y. \tag{3.10}
由于矩阵 W 是正交的,这导致了一个有趣的观察:该方法在数学上等价于使用正交投影过程来计算 A^{-1} 的特征值。在这种情况下,近似子空间是 A \mathcal{K}。因此,近似特征值 \tilde{\lambda} 被称为调和 Ritz 值(harmonic Ritz values)。 注意,不需要对 A 进行求逆,但如果通过在 W 上进行正交变换的同时也在 V 上进行,从而保持形式关系 W = A V,那么可以使用 (3.10) 的左侧来进行约化矩阵的计算。 由于调和 Ritz 值是 A^{-1} 的 Ritz 值(尽管是通过 A 生成的子空间),它们往往能更好地逼近内部特征值(那些最接近原点的特征值)。可以证明,对于厄米矩阵 A,调和 Ritz 向量最大化 A^{-1} 的 Rayleigh 商,因此可以被解释为我们拥有的关于绝对值最小特征值的最佳信息。这使得调和 Ritz 向量适合用于重启,这一点由 Morgan [331] 在对称矩阵中提出。

调和 Ritz 值和向量的正式引入见 [349],其中还包括了 Ritz 对与调和 Ritz 对之间的有趣关系。研究表明,在 Krylov 子空间的情况下,投影矩阵 W^\ast A^{-1} W 的计算可以通过矩阵 V^\ast A V 的秩一更新获得,因此调和 Ritz 对可以作为常规 Krylov 过程的廉价副产品生成。调和 Ritz 值对更一般子空间的推广发表在 [411]。

由于 A^{-1} 的投影是在为 A 生成的子空间上进行的,因此不应期望此方法能与在 A^{-1} 生成的 Krylov 子空间上的投影一样好。实际上,调和 Ritz 值对于内部特征值的近似越来越好,但对于不断增大的子空间,改进可能非常有限(尽管稳定)。因此,它们通常不能替代位移-逆变换技术,除非成功构建了合适的子空间,例如通过使用廉价的近似位移-逆变换技术,如在 (Jacobi-) Davidson 方法中。

我们将更详细地讨论调和 Ritz 值和 Ritz 值在厄米情况 A^\ast =A 下的行为。假设 A 的特征值按大小顺序排列:

\lambda_1 \le \lambda_2 \le \cdots \le \lambda_n.
类似的标记也适用于近似值 \tilde{\lambda}_i

如前所述,Ritz 值逼近厄米矩阵 A 的特征值是“由内而外”的,即最右侧的特征值从下方逼近,而最左侧的特征值从上方逼近,如下图所示。

这一原则也适用于调和 Ritz 值:由于这些值是通过应用于 A^{-1} 的正交投影方法得到的,因此从该过程中获得的调和 Ritz 特征值 1/\tilde{\lambda}_i 将以“由内而外”的方式逼近 A 的相应特征值 1/\lambda_i。对于正特征值,我们有
\tilde{\lambda}_i^{-1} \le \lambda_i ^{-1}; \quad i=1,2, \ldots\qquad \longrightarrow \qquad\tilde{\lambda}_i \ge \lambda_i; \quad i=1,2, \ldots.
注意到,最大的正特征值现在从上方逼近,这与标准的正交投影方法相反。这些类型的技术在几十年前很流行,作为一种确保包含给定特征值的区间的策略。事实上,如 [349] 所示,Ritz 值与调和 Ritz 值共同构成了所谓的 Lehmann 区间,它们对 A 的特征值具有良好的包含性质。从某种意义上说,它们提供了从给定 Krylov 子空间导出的关于 A 特征值的最优信息。例如,可以通过正交投影方法和调和投影方法分别获得最大正特征值的下界和上界。

我们以调和 Ritz 值的如下观察来结束讨论:它们也可以针对移位矩阵 A-\sigma I 进行计算,从而使得近似值对于接近 \sigma 的特征值得到改进。



下一节:改进的投影法 上一级:基本概念 上一节:斜投影法
Susan Blackford 2000-11-20