关于NHEP的相关理论介绍及文献指引,请参阅第2.5节。特别指出,这些问题的扰动理论颇为复杂。应记住,对于计算出的特征对 \widehat{\lambda}, \widehat{x},残差 A\widehat{x}-\widehat{\lambda}\widehat{x} 的范数小并不必然意味着计算值的误差小。更多信息请参见第2.5节和第7.13节。在此,我们将简要介绍在算法选择中起作用的一些方面,随后将对本章涉及的不同类方法进行简要描述。
与厄米矩阵不同,非厄米矩阵不具备正交的特征向量集;换句话说,非厄米矩阵 A 通常不能通过正交矩阵 Q 变换为对角形式 D=Q^\ast A Q。多数非厄米矩阵可通过非正交矩阵 X 变换为对角形式 D=X^{-1}AX,但存在一些矩阵甚至无法做到这一点。这类矩阵可视为极限情况,其中 X 趋向于奇异算子,且它们不具备完整的特征向量集;它们被称为缺陷矩阵。这揭示了数值不稳定的来源:如果 X 在某种意义上接近奇异算子,那么变换可能对 A 的扰动敏感。这些扰动由计算 X 和 D 的过程引入。因此,尽可能多地使用正交或接近正交的变换至关重要。众所周知,对于任何非厄米矩阵 A,存在一个酉矩阵 U 将其变换为上三角形式
舒尔形式的约简可以实现,但代价不小。设 n 为非厄米矩阵 A 的阶数。对于 n>3,通常不存在有限算法将 A 约简为舒尔形式(排除如 A 已为上三角形式的简单情况)。对于阶数适中的矩阵,如 n\le 1000,通常先将其约简为上海森堡形式,这可以在有限步骤内完成。随后通过迭代方式(QR迭代)将此上海森堡矩阵约简为舒尔形式。更多细节及软件指引请参见第7.3节。
这种标准方法的主要问题是计算成本与 n^3 成正比(因此限制了矩阵阶数最多为几千),并且需要存储与 n^2 个元素成正比的存储空间。通常无法利用矩阵 A 的稀疏性来减少存储需求。因此,提出了替代方案。这些替代方案完全迭代,即没有有限的直接约简步骤。它们通常仅适用于计算少数感兴趣的特征对。现在我们将简要总结本章将介绍的迭代方法。
正交化过程导致一个 m 乘 m 的上海森堡矩阵 H_m(该方法仅在 m\ll n 时实用),并且该矩阵可以被解释为矩阵 A 在Krylov子空间上的适当约简形式。H_m 的特征值是 A 的一些特征值的近似,并且可以通过与上述讨论的小稠密矩阵相同的标准方法将 H_m 约简为舒尔形式来计算。Arnoldi方法的介绍见第7.5节。 设计了巧妙的重启技术,以尽可能降低内存需求和计算开销:这些技术被称为隐式重启Arnoldi方法(IRAMs),并在第7.6节中讨论。 Arnoldi方法的计算开销不太适合并行化,特别是对于某些分布式内存计算机。为了创建更大的计算与内存引用比率,提出了块变体。这些块Arnoldi变体在第7.7节中讨论。
Lanczos方法的块版本及其名为ABLE的实现,在第7.9节中介绍。ABLE是一种自适应块方法,旨在治愈崩溃,并试图消除导致缓慢收敛的原因(如双正交性的损失和附近特征值的聚集)。在Krylov子空间内的缩减被很好地纳入另一种变体,即带状Lanczos方法,在第7.10节中介绍。这是专门为高维多输入和多输出线性动态系统的降阶建模设计的。
针对复对称系统的双侧Lanczos方法的变体在第7.11节中讨论。相对于非对称情况,这种变体将CPU时间和计算机存储减少了一半。
在表7.1中,我们总结了各种类方法。该表并非旨在替代进一步阅读;它仅作为起点,并可能帮助读者发现哪种方法最适合哪种需求。每种方法的实际性能通常取决于许多参数,且一种方法对于某一类问题最佳,可能对某些特定矩阵会遇到收敛问题。
算法 | 模式 | FL-\lambda | \lambda-ext | \lambda-int | 内存/开销 |
幂迭代 | A | 慢 | 否 | 否 | 低 |
(A - \sigma I)^{-1} | 是 | 否 | 否 | 低 | |
子空间迭代 | A | 是 | 是 | 否 | 适中 |
(A - \sigma I)^{-1} | 是 | 是 | 是 | 适中 | |
Arnoldi | A | 是 | 是 | 否 | 适中 |
(IRAM) | (A - \sigma I)^{-1} | 是 | 是 | 是 | 适中 |
Lanczos | A | 是 | 是 | 否 | 低 |
(A - \sigma I)^{-1} | 是 | 是 | 是 | 低 | |
块Lanczos | A | 是 | 是 | 否 | 适中 |
(A - \sigma I)^{-1} | 是 | 是 | 是 | 适中 | |
Jac.-Dav. | A | 是 | 是 | 慢 | 适中 |
(A - \sigma I)^{-1} | 是 | 是 | 是 | 适中 | |
预条件 | 是 | 是 | 是 | 适中 |
表7.1解释