下一节:计算所得特征值的误差界限 上一级:稳定性与准确性评估 上一节:残差向量


将残差误差转化为后向误差

事实证明,计算出的特征值和特征向量总是可以解释为邻近矩阵的确切特征值和特征向量,即
(A+E)\widetilde x=\widetilde\lambda\widetilde x,
以及
\widetilde y^{\ast} (A+E)=\widetilde\lambda\widetilde y^{\ast}
如果 \widetilde y 可用,其中误差矩阵 E 在范数上相对于 \Vert A\Vert 通常较小。这种解释有两个目的:首先,它间接反映了特征问题解决的准确程度;其次,它可以用来推导下面将要讨论的计算特征值和特征向量的误差界限。理想情况下,我们希望 E 是零矩阵,但实际上这几乎从未发生。有无限多个误差矩阵 E 满足上述方程,我们想知道的只是最优或近似最优的误差矩阵,即某些范数(通常是2-范数 \Vert\cdot\Vert _2 或 Frobenius 范数 \Vert\cdot\Vert _{F})在所有可行误差矩阵中被最小化。事实上,如果我们能确定这些(近似)最优矩阵的范数上界,就能满足实际需求。以下结果集确实表明,如果 r(以及 s^{\ast},如果可用)很小,误差矩阵 E 也很小 [425]。

我们区分两种情况。

  1. 只有 \widetilde x 可用,但 \widetilde y 不可用。那么最优误差矩阵 E(在2-范数和 Frobenius 范数中)使得 \widetilde\lambda\widetilde x 成为 A+E 的确切特征值及其对应的特征向量,即
    (A+E)\widetilde x=\widetilde\lambda\widetilde x, \tag{7.104}
    满足
    \Vert E\Vert _2=\Vert E\Vert _{F}=\Vert r\Vert_2.

  2. \widetilde x\widetilde y 都可用。那么最优误差矩阵 E_2(在2-范数中)和 E_{F}(在 Frobenius 范数中)使得 \widetilde\lambda\widetilde x\widetilde y 成为 A+E 的确切特征值及其对应的特征向量,即
    (A+E)\widetilde x=\widetilde\lambda\widetilde x\quad\mathrm{and}\quad\widetilde y^{\ast} (A+E)=\widetilde\lambda\widetilde y^{\ast} \tag{7.105}
    对于 E=E_2, E_{F},满足
    \Vert E_2\Vert _2=\max\{\Vert r\Vert _2,\Vert s^{\ast}\Vert _2\}
    以及
    \Vert E_{F}\Vert _{F}=\sqrt{\Vert r\Vert^2_2 +\Vert s^{\ast}\Vert_2^2 - (\widetilde y^{\ast} A\widetilde x-\widetilde\lambda\widetilde y^{\ast}\widetilde x)^2}.
参见 [256,431]。

我们称提供近似特征对 (\widetilde\lambda,\widetilde x) 的算法为 \tau-后向稳定 对于该对关于范数 \Vert\cdot\Vert 如果它是 A+E 的确切特征对且 \Vert E\Vert\le\tau;类似地,提供特征三元组 (\widetilde\lambda,\widetilde x,\widetilde y) 的算法为 \tau-后向稳定 对于该三元组关于范数 \Vert\cdot\Vert 如果它是 A+E 的确切特征三元组且 \Vert E\Vert\le\tau。考虑到这些,可以对计算特征对 (\widetilde\lambda,\widetilde x) 或特征三元组 (\widetilde\lambda,\widetilde x,\widetilde y) 的算法的后向稳定性做出陈述。传统上,如果 \tau = O(\epsilon_M \Vert A\Vert),算法被称为 后向稳定



下一节:计算所得特征值的误差界限 上一级:稳定性与准确性评估 上一节:残差向量
Susan Blackford 2000-11-20