下一节:协变微分法 上一级:几何技术细节 上一节:内积、梯度与微分

绕过\mathrm{Stief}(n,k)

我们已经为在约束流形环境下定义梯度奠定了基础。此时,人们可能会急于尝试进行最速下降搜索以最大化目标函数。然而,当发现无法合理地将一个点和位移组合以产生新点时,问题就会出现,因为对于有限的sY+sH会违反约束方程,从而不在流形上。

对于任何流形,更新Y的方法是求解一组形式为的微分运动方程

\begin{aligned} \frac{d}{dt} Y &= H, \\ \frac{d}{dt} H &= - \Gamma(H,H). \end{aligned}
其中\Gamma项的设计确保H始终保持为切向量,从而使路径保持在流形上。它被称为联络(联络项也依赖于Y)。

为了了解如何满足这些方程,我们取H的无穷小约束方程

H^* Y + Y^* H = 0,
并对t求导,得到
\Gamma(H,H)^*Y + Y^* \Gamma(H,H) = 2 H^*H.
这通常可以通过\Gamma(H,H) = Y(H^* H) + T(H,H)来满足,其中T(H,H)是某个任意切向量。

在下一个小节中,我们将有理由考虑H_1 \ne H_2时的\Gamma(H_1,H_2)。出于技术原因,通常要求

\Gamma(H_1,H_2) = \Gamma(H_2,H_1)
(这称为无挠性质)以及
ip(\Gamma(H_1,H_3),H_2)+ip(H_1,\Gamma(H_2,H_3))=0
(这称为度量兼容性质)。这两个性质唯一确定了T(H_1,H_2)项,从而唯一指定了联络。在任何流形上,具有这些性质的唯一联络称为Levi-Civita联络。

Edelman、Arias和Smith在他们的工作中(见[151,155,416])找到了使用两种不同内积(欧几里得和典型)的Stiefel流形的联络。模板软件中的函数connection计算\Gamma(H_1,H_2)

通常,在流形上求解运动方程非常困难。对于Stiefel流形,存在解析解,可以在前述文献中找到,但我们发现,只要位移较小,通过运动方程沿路径移动与对Y+sH进行正交化分解之间性能下降很少。函数move支持多种测地线运动方法,取决于所需的近似程度。



下一节:协变微分法 上一级:几何技术细节 上一节:内积、梯度与微分
Susan Blackford 2000-11-20