预处理Lanczos方法

下一节：Davidson方法 上一级：预条件特征值求解器 上一节：预处理最速上升/下降法

预处理Lanczos方法

预处理Lanczos方法由Scott[397]提出，当时 $T=I$ ，并由Knyazev[264,265]进行了分析。该方法基于内外迭代的基本思想，我们在此针对矩阵束 $B - \mu A$ 进行描述。

设定参数 $\mu$ 为固定值。我们考虑以下辅助特征值问题：

T (B- \mu A)v= \nu v. \tag{11.14}

若 $\mu = \mu_1$ ，则存在零特征值 $\nu$ ，且对应的特征向量在式(11.14)中也是原矩阵束 $B - \mu A$ 对应于 $\mu_1$ 的特征向量。该零特征值是矩阵 $T (B- \mu A)$ 的最大特征值，并与其他负特征值分离开来。因此，可采用标准的多项式方法（特别是Lanczos方法）计算该值。我们注意到，决定收敛速度的分离程度依赖于预处理矩阵 $T$ 的质量；详见[264,265]。

在方法中，我们选择参数 $\mu= \mu^{(0)}$ 的初始值，然后利用若干Lanczos内迭代求解式(11.14)的最大特征值。假设预处理矩阵 $T$ 为对称正定，则矩阵 $T (B- \mu A)$ 相对于 $T^{-1}$ 基的标量积是对称的，因此可采用经典的Lanczos方法结合此标量积进行计算；参见§4.4。随后，新的 $\mu = \mu^{(1)}$ 值通过原矩阵束对最近内迭代向量迭代的Rayleigh商计算得出。此向量亦作为下一轮内迭代的初始猜测。这种内外迭代方法显然符合我们定义的预处理特征求解器。

我们在算法11.7中展示了针对矩阵束 $B - \mu A$ 的单向量版本方法。

算法 11.7：预处理Lanczos方法用于广义特征值问题

(1) 选择一个初始向量  $x^{(0)}$ 。
(2) 对于 i=0,..., 直到收敛执行：
(3)  $\mu^{(i)}:=\left(x^{(i)}, B x^{(i)}\right)/\left(x^{(i)}, A x^{(i)}\right)$ 
(4) 应用  $l_{i}$  步经典Lanczos方法，使用内积  $(x,T^{-1}y)$ ，以找到  $T(B-\mu^{(i)}A)$  的最大特征值和对应的特征向量，使用向量  $x^{(i)}$  作为初始猜测。
(5)  $x^{(i+1)}:=$  Lanczos方法的最新向量迭代

Scott[397]证明了对于完全收敛的内迭代过程，外迭代具有渐近二次收敛性。当然，这并不保证在有限内迭代次数下方法的收敛性。任意内迭代次数的显式收敛率估计已由[264,265]建立。结果显示，首先，对于任意固定内迭代次数，例如仅一次，方法至少线性收敛；其次，内迭代次数的缓慢但无限增长可改善平均内迭代次数的收敛率估计。

预处理Lanczos方法可能比预处理最速下降/上升法收敛更快。此外，若在内迭代中采用无重正交化的标准三项递归，则每次迭代的计算成本与预处理最速下降/上升法相近。

主要缺点在于Lanczos过程中需要基于 $T^{-1}$ 的标量积，因此应易于计算向量 $T^{-1}x$ 。对于某些预处理矩阵，如基于域分解的预处理矩阵，可能仅能高效计算 $Tx$ （这也是必需的），而无法计算 $T^{-1}x$ 。

在这种情况下，我们仍可为算子 $T(B - \mu^{(i)}A)$ 构造Krylov子空间，并利用Rayleigh-Ritz方法将算子 $B - \mu A$ 投影到该子空间。示意如下：

\begin{aligned} \mu (x^{(i+1)}) &= {\rm max}_{ x \in {\mathcal{K}} \mu(x)}, \\ \mathcal{K} &= \mathrm{span}\{x^{(i)}, T(B-\mu^{(i)}A)x^{(i)}, \ldots, [T(B- \mu^{(i)} A)]^{l_i}x^{(i)} \} \end{aligned}\tag{11.15}

其中

l_i

为第

i

次外迭代步骤的内迭代步数。

这引出了算法11.8，可通过修改算法11.7的第(4)和(5)行得到：

算法 11.8：预处理投影方法用于广义特征值问题

(1) 选择一个初始向量  $x^{(0)}$ 。
(2) 对于 i=0,..., 直到收敛执行：
(3)      $\mu^{(i)}:=\left(x^{(i)}, B\, x^{(i)}\right)/\left(x^{(i)}, A\, x^{(i)}\right)$ 
(4)     使用矩阵  $T(B-\mu^{(i)}A)$  和向量  $x^{(i)}$  作为初始猜测，构建  $(l1+1)$  维Krylov子空间
(4a)    对  $B-\mu^{(i)}A$  应用Rayleigh-Ritz方法
(5)      $x^{(i+1)}:=$  对应最小Ritz值的Ritz向量

该方法由[264,265]提出，后在[336]中重新发现。若仅使用一次内迭代，该方法等同于预处理最速下降/上升算法11.6。

由于与预处理Lanczos过程的相似性，大部分收敛理论及主要结论同样适用于此过程；详细内容参见[264,265]。预处理投影算法11.8在相同内迭代次数下比预处理Lanczos算法11.7收敛稍快。然而，现在只能使用标准三项递归计算Krylov子空间的基。为实现Rayleigh-Ritz方法，我们需要存储基中的所有向量并显式计算所有标量积，这增加了计算投影矩阵的成本并显著提高了存储需求，除非采用重启机制。

下一节：Davidson方法 上一级：预条件特征值求解器 上一节：预处理最速上升/下降法

Susan Blackford 2000-11-20