下一节:协变微分法
上一级:几何技术细节
上一节:内积、梯度与微分
我们已经为在约束流形环境下定义梯度奠定了基础。此时,人们可能会急于尝试进行最速下降搜索以最大化目标函数。然而,当发现无法合理地将一个点和位移组合以产生新点时,问题就会出现,因为对于有限的s,Y+sH会违反约束方程,从而不在流形上。
对于任何流形,更新Y的方法是求解一组形式为的微分运动方程
\begin{aligned}
\frac{d}{dt} Y &= H, \\
\frac{d}{dt} H &= - \Gamma(H,H).
\end{aligned}
其中\Gamma项的设计确保H始终保持为切向量,从而使路径保持在流形上。它被称为联络(联络项也依赖于Y)。
为了了解如何满足这些方程,我们取H的无穷小约束方程
H^* Y + Y^* H = 0,
并对t求导,得到
\Gamma(H,H)^*Y + Y^* \Gamma(H,H) = 2 H^*H.
这通常可以通过\Gamma(H,H) = Y(H^* H) + T(H,H)来满足,其中T(H,H)是某个任意切向量。
在下一个小节中,我们将有理由考虑H_1 \ne H_2时的\Gamma(H_1,H_2)。出于技术原因,通常要求
\Gamma(H_1,H_2) = \Gamma(H_2,H_1)
(这称为无挠性质)以及
ip(\Gamma(H_1,H_3),H_2)+ip(H_1,\Gamma(H_2,H_3))=0
(这称为度量兼容性质)。这两个性质唯一确定了T(H_1,H_2)项,从而唯一指定了联络。在任何流形上,具有这些性质的唯一联络称为Levi-Civita联络。
Edelman、Arias和Smith在他们的工作中(见[151,155,416])找到了使用两种不同内积(欧几里得和典型)的Stiefel流形的联络。模板软件中的函数connection
计算\Gamma(H_1,H_2)。
通常,在流形上求解运动方程非常困难。对于Stiefel流形,存在解析解,可以在前述文献中找到,但我们发现,只要位移较小,通过运动方程沿路径移动与对Y+sH进行正交化分解之间性能下降很少。函数move
支持多种测地线运动方法,取决于所需的近似程度。
下一节:协变微分法
上一级:几何技术细节
上一节:内积、梯度与微分
Susan Blackford
2000-11-20