下一节:可用的软件
上一级:隐式重启Arnoldi方法
上一节:锁定或清除单个特征值
特征向量计算与谱变换
SI(谱变换)在
§3.3节中被引入。具体来说,我们使用矩阵
C \equiv (A - \sigma I)^{-1}
代替A,并利用以下事实
C x = x \theta \iff A x = x \left(\sigma + \frac{1}{\theta}\right)
来恢复原矩阵的特征值。与SI结合使用时,Arnoldi方法极为有效。通常,收敛到与\sigma最接近的A的特征值对应的特征向量非常迅速。因此,只要能高效求解系数矩阵为A-\sigma I的线性系统,就应采用这种方法。
当使用谱变换时,应考虑额外的停止准则,以利用变换后算子C的特殊性质。此外,通过少量的后处理,近似特征向量的质量可以显著提高。为了计算接近\sigma的A的特征值,我们将计算C的最大量级的特征值\theta。实际上,\sigma不必非常接近所需的特征值。然而,在接下来的讨论中,值得注意的是,实践中通常取\sigma接近所需的特征值,因此通常\vert\theta\vert \gg 1成立。
令x = V_m y且H_m y = y \theta,其中\Vert y \Vert _2=1。由于
(A-\sigma I)^{-1}x - x \theta = CV_my - V_mH_my = f_m \, e^\ast_my, \tag{7.23}
因此,\Vert f_m\Vert\,\vert e^\ast_my\vert是残差\Vert Cx - x \theta \Vert的范数。如果\Vert f_m\Vert\,\vert e^\ast_my\vert \leq \epsilon_U,其中\epsilon_U是用户指定的容差,那么根据 (7.17),x和\theta是C附近矩阵的精确特征对。然而,我们真正感兴趣的是原矩阵A的特征值-特征向量近似。
简单地重排 (7.23)得到
Ax - x\left(\sigma + \frac{1}{\theta}\right) =-(A - \sigma I) f_m \frac{e^\ast_my}{\theta}, \tag{7.24}
这是计算得到的特征对(x , \sigma + \frac{1}{\theta})对于矩阵A的残差。然而,通过少量的额外算术运算,可以显著提高特征向量的质量并减少相应的残差范数。
在 (7.24)的右侧加上并减去f_m \frac{e^\ast_my}{\theta^2}并重新排列项,将得到
Az - z \left(\sigma + \frac{1}{\theta}\right) =-f_m \frac{e^\ast_my}{\theta^2}, \tag{7.25}
其中z \equiv x + f_m ( e^\ast_m y/\theta)。在\vert\theta\vert \gg 1的情况下,我们看到z将是一个比x好得多的近似特征向量。此外,如果\Vert A\Vert相对于\vert\sigma\vert很大,则避免了由于项(A - \sigma I) f_m引起的误差放大。
一个启发式论点进一步支持使用z而不是x。从 (7.23)可以得出
(A - \sigma I)^{-1}x = x\theta + f_m e^\ast_m y,
因此,z = x + f_m ( e^\ast_m y/\theta)是在x上进行A-\sigma I的一次逆迭代的结果(归一化后)。
这个向量z尚未被缩放为单位范数。然而,
\Vert z \Vert^2 = 1 + \left(\vert e^\ast_m y \vert\Vert f_m \Vert/\vert\theta\vert\right)^2,
所以归一化后误差界将减小。此外,如果{\vert e^\ast_m y \vert\Vert f_m \Vert}/{\vert\theta\vert} < \sqrt{\epsilon_M},那么浮点计算范数将已经得到\Vert z\Vert = 1,无需重新缩放。
从 (7.23),残差C x - x \theta与V_m的列所张成的Krylov空间正交。然而,无论使用x还是z,在将计算得到的特征对转换回原系统时,这种Galerkin条件都会丢失。这是因为\sigma +1/\theta不是x或z的Rayleigh商。然而,从 (7.25)
\left\vert \frac{z^\ast A z}{ z^\ast z} - \left(\sigma +\frac{1}{\theta}\right)\right\vert = \frac{1}{\vert\theta\vert} \left(\frac{\Vert f_m\Vert\vert e_m^* y \vert}{\vert\theta\vert\Vert z \Vert}\right)^2. \tag{7.27}
换句话说,当使用向量z作为近似特征向量时,近似特征值\sigma +1/\theta几乎是A的Rayleigh商。实际上,当\frac{\vert e^\ast_m y \vert\Vert f_m \Vert}{\vert\theta\vert} < \sqrt{\epsilon_M}时,\sigma +1/\theta将在舍入误差水平内成为Rayleigh商。
另一方面,从 (7.24)我们推断出
\left\vert x^\ast A x - \left(\sigma + \frac{1}{\theta}\right)\right\Vert = \frac{\vert x^* A f_m\vert}{\Vert f_m\Vert}\left(\frac{\Vert f_m\Vert\vert e^\ast_my \vert}{\vert\theta\vert} \right) \tag{7.28}
是当使用x时,\sigma +1/\theta作为A的Rayleigh商的误差。
方程 (7.25) 和 (7.27) 表明,只要\vert\theta\vert大于1,向量z就是比x更好的近似特征向量,与近似特征值\sigma +1/\theta相关联。此外,当\vert\theta\vert \gg 1时,只需要一个适度小的Ritz估计就能达到可接受的直接残差和Rayleigh商误差。如果\sigma接近所需的特征值,那么这些特征值通过C映射为大特征值,通常\vert\theta\vert \gg 1。
上述分析基于Ericsson和Ruhe [162]对广义对称正定特征值问题的研究。
下一节:可用的软件
上一级:隐式重启Arnoldi方法
上一节:锁定或清除单个特征值
Susan Blackford
2000-11-20