下一节:算法 上一级:对称不定Lanczos方法 上一节:对称不定Lanczos方法

对称不定矩阵对的一些性质

矩阵 AB 的对称性纯粹是一个代数性质,并不足以保证它们具有确定矩阵束所享有的任何特殊数学性质,如第§2.3节所讨论的。事实上,可以证明任何实方阵 F 都可以表示为 F = AB^{-1}F = B^{-1} A,其中 AB 是合适的对称矩阵;例如,参见[353]。

确定矩阵束的所有特征值都是实数,但一个不定矩阵束可能具有复数特征值。例如,当

A = \left[\begin{array}{cc}0&10\\ 10&20\end{array}\right],\quad B = \left[\begin{array}{cc}-1&0\\ 0&10\end{array}\right],
矩阵对 \{A,B\} 的特征值是复共轭对 1\pm 3i。与确定情况进一步的区别在于,不定矩阵束可能没有完整的特征向量集。例如,考虑矩阵束
\left[\begin{array}{cc}0&1\\ 1&2\end{array}\right]-\lambda\left[\begin{array}{cc}0&1\\ 1&1\end{array}\right],
它有一个特征值 \lambda = 1(重数为2),并且只有一个特征向量 x = [{1 \atop 0}]

在第§2.3节中,我们知道当 B 是正定矩阵时,可以找到特征向量矩阵 X 和特征值对角矩阵 \Lambda,使得 AX = BX \LambdaX^TBX=IB 内积 (x,y)_B 形成一个真正的内积,且 (x,x)_B^{1/2} 是一个范数。

B 是不定且非奇异的,并且如果 B^{-1}A 没有缺陷(即没有缺失特征向量),我们可以找到完整的特征向量集 X。方程 AX = BX \Lambda 仍然成立,并且可以选择特征向量使得 X^TBX=J,其中 J 是对角矩阵,对角线上有 1-1(注意这是转置,而不是共轭转置,即使某些向量可能是复数)。B 内积 (x,y)_B 是一个不定内积或伪内积,(x,x)_B 可用于归一化目的。与正定情况不同,存在一组向量具有伪长度零(由 (x,x)_B 测量)。事实上,一个特征向量 x 可能满足 x^TAx=x^TBx=0。这意味着瑞利商

\rho = \frac{x^TAx}{x^TBx}
是未定义的。这种现象由对角矩阵
A = {\rm diag}(-1,1,1), \quad B = {\rm diag}(1,1,-1)
说明。向量 x = \left[ \begin{array}{ccc}1 & 0 & 1\end{array} \right]^T 是矩阵对 \{A,B\} 对应于重特征值 \lambda = -1 的特征向量,但 x^TAx=x^TBx=0

确定情况和不定情况之间的类比可以进一步展开。当 B 是正定矩阵时,\tilde{u} 是近似特征向量,\tilde{\lambda} 是近似特征值,我们有标准的残差界:

\vert\lambda-\tilde{\lambda}\vert \le \frac{\Vert(A-\tilde{\lambda} B)\tilde{u}\Vert _{B^{-1}}}{\Vert\tilde{u}\Vert _B},
其中 \Vert\cdot \Vert _{B^{-1}} 是关于 B^{-1} 的范数,即 \Vert x \Vert _{B^{-1}}=(x^{\ast}B^{-1}x)^{1/2}(类似地,其他范数也是如此)。另见第§5.7节。当 B 是不定且非奇异的,X^TBX=J,且 B^{-1}A 没有缺陷时,可以证明
\vert\lambda-\tilde{\lambda}\vert \le \frac{\Vert(A-\tilde{\lambda} B)\tilde{u}\Vert _{\bar{X}X^{T}}}{\Vert\tilde{u}\Vert _{(XX^{\ast})^{-1}}};
注意在确定情况下 B^{-1}=XX^{\ast}。类似的界由
\vert\lambda-\tilde{\lambda}\vert \le \frac{\Vert(A-\tilde{\lambda} B)\tilde{u}\Vert_2}{\Vert \tilde{u}\Vert_2}\Vert B^{-1}\Vert _2\Vert X\Vert _2\Vert X^{-1}\Vert _2.
即使这些界不可计算,它们也表明小的残差是好的。当 B 是奇异的,有类似的界;参见[161]。

如果 AB 都是奇异的,或者接近奇异的,可能会出现更严重的问题。假设存在一个非零向量 z 使得 Az=Bz=0;那么任何复数 \lambda 都是一个特征值。一个更一般的情况如下例所示:

A=\left[\begin{array}{ccc}1 & 0 & 0\\0 & -1 & 0\\0 & 0 & 0\end{array}\right],\quad B=\left[\begin{array}{ccc}1 & 0 & 1\\0 & -1 & 1\\1 & 1 & 0\end{array}\right].
特征多项式 \det (A-\lambda B) 恒等于零,因此任何复数都是特征值;我们有一个奇异矩阵束。矩阵 AB 的零空间是一维的,分别由 z_a=[0~0~1]^Tz_b=[-1~1~1]^T 张成。注意零空间之间的交集只是零向量。问题的奇异性意味着 z_a^TBz_a=0(且 z_b^TAz_b=0)。要使用数值方法解决奇异问题,必须消除奇异性。直接攻击原始问题是徒劳的,正如通过扰动 AB 可以看到的那样。设 a_{3,3}=\epsilon 并将 \delta 加到 b_{1,1},则 \det (A-\lambda B)=\delta\lambda^3+\epsilon(\lambda-1)(\lambda(1+\delta)-1)。 因此,如果 \epsilon\delta 非零,这不再是一个奇异矩阵束。取 \delta=0,则对于任何 \epsilon > 0,我们有特征值 1,1\infty。如果 \delta>0\epsilon = 0,特征值是 0,00。当 \delta=\epsilon\rightarrow 0 时,特征值大约是 0.569840.21508\pm1.30714。注意扰动可以任意小。关于奇异矩阵束的一般讨论见第§8.7节。

在实践中,如果我们有一个奇异矩阵束,A - \lambda B 对任何 \lambda 都是奇异的,一个好的 LU 分解例程应该给出警告(当在以下第§8.6.2节中使用时)。奇异矩阵束的另一个迹象是特征值例程在同一问题上每次运行时产生一些随机特征值。



下一节:算法 上一级:对称不定Lanczos方法 上一节:对称不定Lanczos方法
Susan Blackford 2000-11-20