下一节:广义Schur-阶梯形式
上一级:奇异矩阵束
上一节:通用与非通用Kronecker结构
病态条件
奇异矩阵束可能有也可能没有特征值。
事实上,一般情况对应于一个没有特征值的奇异矩阵束。
下面我们通过两个3×3的例子来说明这一点:
A1−λB1=10000000λ,A2−λB2=100−λ0001−λ.
显然,
det(A1−λB1)≡0 和
det(A2−λB2)≡0 对所有 λ 都成立。
尽管这两个矩阵束具有相同的对角元素,但它们的典范形式非常不同。
实际上,这两个矩阵束都处于KCF形式:
A1−λB1=diag(N1,L0,L0T,J1(0))
和
A2−λB2=diag(L1,L1T)。从上到下,
A1−λB1 的对角块分别对应于 N1、diag(L0,L0T) 和 J1。
因此,A1−λB1 有一个大小为 2×2 的正则部分,
其特征值在零 (J1(0)) 和无穷大 (N1),
以及一个大小为 1×1 的奇异部分,对应于一个 L0 块(大小为 0×1)和一个 L0T 块,而
A2−λB2 是一个没有正则部分的通用 3×3 奇异矩阵束。
如果 A−λB 是上三角形式且对角线上出现零元素,则该矩阵束是奇异的。
我们看到这两个例子都具有这一性质
(A1 和 B1 的 (2,2) 元素以及 A2 和 B2 的 (2,2) 元素均为零)。
这种情况会在我们对一个方形的奇异矩阵束应用QZ算法时出现,假设是在无限精度下。
这样的 (α,β)=(0,0) 被称为不确定特征值 0/0。
在存在舍入误差的情况下,QZ算法可能无法检测和隔离奇异性,这是由于问题的病态性,如下所示。
奇异矩阵对的特征值问题比正则矩阵对要复杂得多。
例如,考虑奇异矩阵对
A=[1000],
它有一个有限特征值1和一个不确定特征值0/0
(对应于奇异部分 diag(L0,L0T))。
为了看到特征值1和奇异部分都不能由数据很好地确定,考虑
稍微扰动的问题
A′=[1ϵ2ϵ10],
其中 ϵi 是微小的非零数。
由此可知 {A′,B′} 是正则的,其特征值为
ϵ1/ϵ3 和
ϵ2/ϵ4。
给定任意两个复数 λ1 和 λ2,
我们可以找到任意微小的 ϵi 使得
λ1=ϵ1/ϵ3 和
λ2=ϵ2/ϵ4
是 {A′,B′} 的特征值。
由于原则上舍入误差可能将 {A,B} 变为 {A′,B′},
我们无法期望在没有进一步信息的情况下计算奇异问题的准确或有意义的特征值。
通常,这些信息包括对允许扰动的限制,使得
未扰动和扰动问题具有相似的结构特征。
对于这个例子,正则化要求扰动矩阵束也
具有一个 1×1 的正则部分和一个 1×1 的奇异部分。
一个著名的奇异矩阵束类别是具有相交零空间的矩阵对。
设 x=0 属于 A 和 B 的零空间的交集,即 Ax=Bx=0。
那么对于任何
(α,β),我们有
(βA−αB)x=0,
这意味着矩阵对 {A,B} 是奇异的。
通过检查我们看到 A1 和 B1 上面有一个共同的一维列(和行)零空间,由 x=e2 张成。
相交的列和行零空间的维度分别是
矩阵束KCF中 L0 和 L0T 块的数量。
注意,A 和 B 的零空间的交集是矩阵束奇异的充分条件,但不是必要条件,
如第一个例子中的 A2−λB2 所示。
一个处于Schur形式的矩阵对 {A,B} 可能非常接近奇异,因此具有非常敏感的特征值,即使 A 或 B 的对角线元素都不小。
只要 A 和 B 近似具有一个共同的零空间就足够了。
例如,考虑 16×16 矩阵
A′′=0.110.11⋱⋱0.110.1andB′′=A′′.
那么 {A′′,B′′} 的所有特征值都在1。
将 An1′′ 和 Bn1′′ 改为 10−16 使得
A′′ 和 B′′ 在机器精度下都是奇异的,并且具有一个共同的零向量;即存在一个单位向量 x 使得
∥A′′x∥2=∥B′′x∥2≈O(10−16)。
然后,使用类似于应用于上面 2×2 例子的技术,我们可以证明存在一个 A′′ 和 B′′ 的扰动,范数为
10−16+ϵ,对于任何 ϵ>0,
使得16个扰动特征值具有任意指定的复数值。
考虑到这些例子,我们准备好介绍
GUPTRI形式和用于计算有意义且可靠信息的正则化方法。
下一节:广义Schur-阶梯形式
上一级:奇异矩阵束
上一节:通用与非通用Kronecker结构
Susan Blackford
2000-11-20