下一节
上一级
上一节
目录
索引
下一节: 同时对角化
上一级: 示例问题及其微分
上一节: 带非线性项的迹最小化
同时舒尔分解问题
考虑两个矩阵 A 和 B ,在无误差的情况下它们具有相同的舒尔向量;即存在一个 Y \in {\mathcal O}(n) ,使得 Y^*AY 和 Y^*BY 均为块上三角矩阵,其中 {\mathcal O}(n) 表示 n 阶正交矩阵的集合。现在假设 A 和 B 由于测量误差或其他类型的有损滤波而存在一定噪声。在这种情况下,将 A 上三角化的 Y 可能无法同样地将 B 上三角化。如何找到最佳的 Y 呢?
这个问题是由舒尔德斯(Schilders) [396 ] 提出的,他将问题表述为最小二乘法的最小化:
F(Y) = \frac{1}{2} (\vert\vert\mathrm{low}(Y^*AY)\vert\vert _F^2 + \vert\vert\mathrm{low}(Y^*BY)\vert\vert _F^2 ) ,其中 \mathrm{low}(M) 是一个掩码,返回 M 的块下三角部分,M 被划分为 2 \times 2 的块。
对于这个问题,微分有些棘手,但其推导过程富有启发性:
\begin{aligned}
\mathrm{tr}(V^*d F(Y)) =& \mathrm{tr}(\mathrm{low}(Y^*A Y)^*\mathrm{low}(Y^*A V+V^*A Y)\\
&\mathrm{+low}(Y^*B Y)^*\mathrm{low}(Y^*B V+V^*B Y)), \\
\mathrm{tr}(V^*d F(Y)) =& \mathrm{tr}(\mathrm{low}(Y^*A Y)^*\mathrm{low}(Y^*AV+V^*AY)\\
&\mathrm{+low}(Y^*B Y)^*\mathrm{low}(Y^*BV+V^*BY)), \\
\mathrm{tr}(V^*d F(Y)) =& \mathrm{tr}(V^*(AY\mathrm{low}(Y^*A Y)^* + A^*Y\mathrm{low}(Y^*A Y)\\
&+BY\mathrm{low}(Y^*B Y)^* + B^*Y\mathrm{low}(Y^*B Y))), \\
dF(Y) = & AY\mathrm{low}(Y^*A Y)^* + A^*Y\mathrm{low}(Y^*A Y)\\
&+BY\mathrm{low}(Y^*B Y)^* + B^*Y\mathrm{low}(Y^*B Y).
\end{aligned}
其中,第二等式源于观察到 \mathrm{tr}(\mathrm{low}(M)^*\mathrm{low}(N)) = \mathrm{tr}(\mathrm{low}(M)^*N) ,第三等式则基于迹的性质。
二阶导数由以下公式给出:
\begin{aligned}
\frac{d}{dt}dF(Y(t))\vert_{t=0} = & AH\mathrm{low}(Y^*AY)^* + A^*H\mathrm{low}(Y^*AY) + AY\mathrm{low}\left(\frac{d(Y^*AY)^*}{dt}\right) \\
& + A^*Y \mathrm{low}\left(\frac{d(Y^*AY)}{dt}\right) + BH\mathrm{low}(Y^*BY)^* + B^*H\mathrm{low}(Y^*BY) \\
&+ BY\mathrm{low}\left(\frac{d(Y^*BY)^*}{dt}\right) + B^*Y\mathrm{low}\left(\frac{d(Y^*BY)}{dt}\right).
\end{aligned}
其中 \dot{Y}(0) = H ,\frac{d(Y^*AY)}{dt} \vert _{t=0} = H^*AY + Y^*AH 以及 \frac{d(Y^*BY)}{dt} \vert _{t=0} = H^*BY + Y^*BH 。
下一节
上一级
上一节
目录
索引
下一节: 同时对角化
上一级: 示例问题及其微分
上一节: 带非线性项的迹最小化
Susan Blackford
2000-11-20