下一节:可用的算法概览
上一级:厄米征值问题
上一节:厄米征值问题
引言
本章我们将探讨标准的厄米或(更常见的)实对称矩阵的特征值问题(HEP),
Ax=\lambda x\, \tag{4.1}
其中 A=A^{\ast}。
这是最常见的代数特征值问题,对此我们拥有最可靠的理论和最强大的算法。
关于厄米特征值问题的基本理论概述见第2.2节。
已知问题(4.1)具有 n 个实特征值 \lambda_i,我们可以按递增顺序排列为
\lambda_1 \leq \lambda_2 \leq \cdots \leq \lambda_n。注意,多个特征值可能相同。在许多应用中,矩阵 A 是正定的,即 \lambda_1>0(或半正定,即 \lambda_1\geq 0)。
即使在可以利用正定性的情况下,我们仍选择在本章中处理具有一般特征值分布的厄米矩阵 A。
当 A 是厄米矩阵时,总能找到 n 个相互正交的特征向量 x_i,\,i=1,\dots,n,使得
A=X \Lambda X^{\ast}, \tag{4.2}
其中 \Lambda=\mathrm{diag}(\lambda_i),
X=[x_1,x_2,\dots,x_n],且 X^{\ast}X=I。特征向量 x_i 并非唯一;唯一的是每个不同特征值对应的不变子空间。
对于厄米矩阵 A,不变子空间的维度与特征值的重数相同。重要的是要记住,当某些特征值相同时,它们的特征向量失去了个性:无法断言一组向量是某个多重特征值的唯一特征向量。
两种不同的算法,甚至同一算法的两次运行,都会在不变子空间中给出不同的代表性特征向量。
另一方面,用户有权要求算法产生的特征向量近似彼此正交,即便矩阵具有多重特征值。
A 的特征值总是良态的。
如果对矩阵 A 添加扰动 E,
那么每个特征值的扰动最多不超过谱范数 \Vert E\Vert _2,
\vert\lambda_i(A+E)-\lambda_i(A)\vert\leq \Vert E\Vert_2 \,. \tag{4.3}
还有几个更强的结果,例如 Wielandt-Hoffman 不等式,它表明特征值差的平方和被 E 元素的平方和所控制;详见第4.8节及其参考文献。
在许多情况下,人们关注相对于范数 \Vert A\Vert 较小的特征值,对于这些特征值,不等式(4.3)并不十分令人满意,因为它允许这些小特征值有较大的相对扰动。在某些附加假设下,可以得出相对扰动的扰动界。
对于特征向量的扰动,没有像(4.3)这样简单的结果:必须增加特征值分离的假设。
让我们引用 Davis 和 Kahan 的经典 \sin \theta 定理,见 [101]。
假设 (\mu,z) 是 A 的特征对 (\lambda_i, x_i) 的近似,其中 z 已归一化使得 \Vert z\Vert _2 = 1。
对应于 z 的“最佳” \mu 是 Rayleigh 商 \mu = z^{\ast} A z,因此我们假设 \mu 取此值。
假设 \mu 比 A 的其他任何特征值更接近 \lambda_i,并设 \delta 为 \mu 与其他特征值之间的间隙:
\delta = \min_{\lambda_j \neq \lambda_i} \vert \mu - \lambda_j \vert。
定义残差向量 r 为 r=Az-\mu z;于是我们有
\sin\angle(z,x_i)\leq\frac{\Vert r\Vert _2}{\delta}\,.
在相同的假设下,我们可以得到特征值近似的改进界限,
\vert \mu - \lambda_i \vert \le \min \left\{\Vert r \Vert_2, \frac{\Vert r \Vert_2^2}{\delta}\right\}.
这个最小值中的第一个选项等价于先前的界(4.3),因为 \mu 是扰动矩阵 A+E 的特征值,其中 E=-rz^{\ast} 是一个范数为 \Vert E\Vert _2 = \Vert r\Vert _2 的秩一扰动(在界(4.3)中,E 不必是厄米矩阵)。
读者可参考第4.8节了解更多细节。
小节
下一节:可用的算法概览
上一级:厄米征值问题
上一节:厄米征值问题
Susan Blackford
2000-11-20