下一节:可用的算法概览 上一级:厄米征值问题 上一节:厄米征值问题

引言

本章我们将探讨标准的厄米或(更常见的)实对称矩阵的特征值问题(HEP),
Ax=\lambda x\, \tag{4.1}
其中 A=A^{\ast}。 这是最常见的代数特征值问题,对此我们拥有最可靠的理论和最强大的算法。

关于厄米特征值问题的基本理论概述见第2.2节。 已知问题(4.1)具有 n 个实特征值 \lambda_i,我们可以按递增顺序排列为 \lambda_1 \leq \lambda_2 \leq \cdots \leq \lambda_n。注意,多个特征值可能相同。在许多应用中,矩阵 A 是正定的,即 \lambda_1>0(或半正定,即 \lambda_1\geq 0)。 即使在可以利用正定性的情况下,我们仍选择在本章中处理具有一般特征值分布的厄米矩阵 A

A 是厄米矩阵时,总能找到 n 个相互正交的特征向量 x_i,\,i=1,\dots,n,使得

A=X \Lambda X^{\ast}, \tag{4.2}
其中 \Lambda=\mathrm{diag}(\lambda_i)X=[x_1,x_2,\dots,x_n],且 X^{\ast}X=I。特征向量 x_i 并非唯一;唯一的是每个不同特征值对应的不变子空间。 对于厄米矩阵 A,不变子空间的维度与特征值的重数相同。重要的是要记住,当某些特征值相同时,它们的特征向量失去了个性:无法断言一组向量是某个多重特征值的唯一特征向量。 两种不同的算法,甚至同一算法的两次运行,都会在不变子空间中给出不同的代表性特征向量。 另一方面,用户有权要求算法产生的特征向量近似彼此正交,即便矩阵具有多重特征值。

A 的特征值总是良态的。 如果对矩阵 A 添加扰动 E, 那么每个特征值的扰动最多不超过谱范数 \Vert E\Vert _2

\vert\lambda_i(A+E)-\lambda_i(A)\vert\leq \Vert E\Vert_2 \,. \tag{4.3}
还有几个更强的结果,例如 Wielandt-Hoffman 不等式,它表明特征值差的平方和被 E 元素的平方和所控制;详见第4.8节及其参考文献。 在许多情况下,人们关注相对于范数 \Vert A\Vert 较小的特征值,对于这些特征值,不等式(4.3)并不十分令人满意,因为它允许这些小特征值有较大的相对扰动。在某些附加假设下,可以得出相对扰动的扰动界。

对于特征向量的扰动,没有像(4.3)这样简单的结果:必须增加特征值分离的假设。 让我们引用 Davis 和 Kahan 的经典 \sin \theta 定理,见 [101]。

假设 (\mu,z)A 的特征对 (\lambda_i, x_i) 的近似,其中 z 已归一化使得 \Vert z\Vert _2 = 1。 对应于 z 的“最佳” \mu 是 Rayleigh 商 \mu = z^{\ast} A z,因此我们假设 \mu 取此值。 假设 \muA 的其他任何特征值更接近 \lambda_i,并设 \delta\mu 与其他特征值之间的间隙\delta = \min_{\lambda_j \neq \lambda_i} \vert \mu - \lambda_j \vert。 定义残差向量 rr=Az-\mu z;于是我们有

\sin\angle(z,x_i)\leq\frac{\Vert r\Vert _2}{\delta}\,.
在相同的假设下,我们可以得到特征值近似的改进界限,
\vert \mu - \lambda_i \vert \le \min \left\{\Vert r \Vert_2, \frac{\Vert r \Vert_2^2}{\delta}\right\}.
这个最小值中的第一个选项等价于先前的界(4.3),因为 \mu 是扰动矩阵 A+E 的特征值,其中 E=-rz^{\ast} 是一个范数为 \Vert E\Vert _2 = \Vert r\Vert _2 的秩一扰动(在界(4.3)中,E 不必是厄米矩阵)。 读者可参考第4.8节了解更多细节。



小节

下一节:可用的算法概览 上一级:厄米征值问题 上一节:厄米征值问题
Susan Blackford 2000-11-20