下一节:同时对角化 上一级:示例问题及其微分 上一节:带非线性项的迹最小化

同时舒尔分解问题

考虑两个矩阵 AB,在无误差的情况下它们具有相同的舒尔向量;即存在一个 Y \in {\mathcal O}(n),使得 Y^*AYY^*BY 均为块上三角矩阵,其中 {\mathcal O}(n) 表示 n 阶正交矩阵的集合。现在假设 AB 由于测量误差或其他类型的有损滤波而存在一定噪声。在这种情况下,将 A 上三角化的 Y 可能无法同样地将 B 上三角化。如何找到最佳的 Y 呢?

这个问题是由舒尔德斯(Schilders) [396] 提出的,他将问题表述为最小二乘法的最小化: F(Y) = \frac{1}{2} (\vert\vert\mathrm{low}(Y^*AY)\vert\vert _F^2 + \vert\vert\mathrm{low}(Y^*BY)\vert\vert _F^2 ),其中 \mathrm{low}(M) 是一个掩码,返回 M 的块下三角部分,M 被划分为 2 \times 2 的块。

对于这个问题,微分有些棘手,但其推导过程富有启发性:

\begin{aligned} \mathrm{tr}(V^*d F(Y)) =& \mathrm{tr}(\mathrm{low}(Y^*A Y)^*\mathrm{low}(Y^*A V+V^*A Y)\\ &\mathrm{+low}(Y^*B Y)^*\mathrm{low}(Y^*B V+V^*B Y)), \\ \mathrm{tr}(V^*d F(Y)) =& \mathrm{tr}(\mathrm{low}(Y^*A Y)^*\mathrm{low}(Y^*AV+V^*AY)\\ &\mathrm{+low}(Y^*B Y)^*\mathrm{low}(Y^*BV+V^*BY)), \\ \mathrm{tr}(V^*d F(Y)) =& \mathrm{tr}(V^*(AY\mathrm{low}(Y^*A Y)^* + A^*Y\mathrm{low}(Y^*A Y)\\ &+BY\mathrm{low}(Y^*B Y)^* + B^*Y\mathrm{low}(Y^*B Y))), \\ dF(Y) = & AY\mathrm{low}(Y^*A Y)^* + A^*Y\mathrm{low}(Y^*A Y)\\ &+BY\mathrm{low}(Y^*B Y)^* + B^*Y\mathrm{low}(Y^*B Y). \end{aligned}
其中,第二等式源于观察到 \mathrm{tr}(\mathrm{low}(M)^*\mathrm{low}(N)) = \mathrm{tr}(\mathrm{low}(M)^*N),第三等式则基于迹的性质。

二阶导数由以下公式给出:

\begin{aligned} \frac{d}{dt}dF(Y(t))\vert_{t=0} = & AH\mathrm{low}(Y^*AY)^* + A^*H\mathrm{low}(Y^*AY) + AY\mathrm{low}\left(\frac{d(Y^*AY)^*}{dt}\right) \\ & + A^*Y \mathrm{low}\left(\frac{d(Y^*AY)}{dt}\right) + BH\mathrm{low}(Y^*BY)^* + B^*H\mathrm{low}(Y^*BY) \\ &+ BY\mathrm{low}\left(\frac{d(Y^*BY)^*}{dt}\right) + B^*Y\mathrm{low}\left(\frac{d(Y^*BY)}{dt}\right). \end{aligned}
其中 \dot{Y}(0) = H\frac{d(Y^*AY)}{dt} \vert _{t=0} = H^*AY + Y^*AH 以及 \frac{d(Y^*BY)}{dt} \vert _{t=0} = H^*BY + Y^*BH



下一节:同时对角化 上一级:示例问题及其微分 上一节:带非线性项的迹最小化
Susan Blackford 2000-11-20