下一节：可用的算法概览 上一级：厄米征值问题 上一节：厄米征值问题

引言

本章我们将探讨标准的厄米或（更常见的）实对称矩阵的特征值问题（HEP），

Ax=\lambda x\, \tag{4.1}

其中

A=A^{\ast}

。这是最常见的代数特征值问题，对此我们拥有最可靠的理论和最强大的算法。

关于厄米特征值问题的基本理论概述见第2.2节。已知问题（4.1）具有 $n$ 个实特征值 $\lambda_i$ ，我们可以按递增顺序排列为 $\lambda_1 \leq \lambda_2 \leq \cdots \leq \lambda_n$ 。注意，多个特征值可能相同。在许多应用中，矩阵 $A$ 是正定的，即 $\lambda_1>0$ （或半正定，即 $\lambda_1\geq 0$ ）。即使在可以利用正定性的情况下，我们仍选择在本章中处理具有一般特征值分布的厄米矩阵 $A$ 。

当 $A$ 是厄米矩阵时，总能找到 $n$ 个相互正交的特征向量 $x_i,\,i=1,\dots,n$ ，使得

A=X \Lambda X^{\ast}, \tag{4.2}

其中

\Lambda=\mathrm{diag}(\lambda_i)

，

X=[x_1,x_2,\dots,x_n]

，且

X^{\ast}X=I

。特征向量

x_i

并非唯一；唯一的是每个不同特征值对应的不变子空间。对于厄米矩阵

A

，不变子空间的维度与特征值的重数相同。重要的是要记住，当某些特征值相同时，它们的特征向量失去了个性：无法断言一组向量是某个多重特征值的唯一特征向量。两种不同的算法，甚至同一算法的两次运行，都会在不变子空间中给出不同的代表性特征向量。另一方面，用户有权要求算法产生的特征向量近似彼此正交，即便矩阵具有多重特征值。

$A$ 的特征值总是良态的。如果对矩阵 $A$ 添加扰动 $E$ ，那么每个特征值的扰动最多不超过谱范数 $\Vert E\Vert _2$ ，

\vert\lambda_i(A+E)-\lambda_i(A)\vert\leq \Vert E\Vert_2 \,. \tag{4.3}

还有几个更强的结果，例如 Wielandt-Hoffman 不等式，它表明特征值差的平方和被

E

元素的平方和所控制；详见第4.8节及其参考文献。在许多情况下，人们关注相对于范数

\Vert A\Vert

较小的特征值，对于这些特征值，不等式（4.3）并不十分令人满意，因为它允许这些小特征值有较大的相对扰动。在某些附加假设下，可以得出相对扰动的扰动界。

对于特征向量的扰动，没有像（4.3）这样简单的结果：必须增加特征值分离的假设。让我们引用 Davis 和 Kahan 的经典 $\sin \theta$ 定理，见 [101]。

假设 $(\mu,z)$ 是 $A$ 的特征对 $(\lambda_i, x_i)$ 的近似，其中 $z$ 已归一化使得 $\Vert z\Vert _2 = 1$ 。对应于 $z$ 的“最佳” $\mu$ 是 Rayleigh 商 $\mu = z^{\ast} A z$ ，因此我们假设 $\mu$ 取此值。假设 $\mu$ 比 $A$ 的其他任何特征值更接近 $\lambda_i$ ，并设 $\delta$ 为 $\mu$ 与其他特征值之间的间隙： $\delta = \min_{\lambda_j \neq \lambda_i} \vert \mu - \lambda_j \vert$ 。定义残差向量 $r$ 为 $r=Az-\mu z$ ；于是我们有

\sin\angle(z,x_i)\leq\frac{\Vert r\Vert _2}{\delta}\,.

在相同的假设下，我们可以得到特征值近似的改进界限，

\vert \mu - \lambda_i \vert \le \min \left\{\Vert r \Vert_2, \frac{\Vert r \Vert_2^2}{\delta}\right\}.

这个最小值中的第一个选项等价于先前的界（4.3），因为

\mu

是扰动矩阵

A+E

的特征值，其中

E=-rz^{\ast}

是一个范数为

\Vert E\Vert _2 = \Vert r\Vert _2

的秩一扰动（在界（4.3）中，

E

不必是厄米矩阵）。读者可参考第4.8节了解更多细节。

小节

下一节：可用的算法概览 上一级：厄米征值问题 上一节：厄米征值问题

Susan Blackford 2000-11-20