A Brief Survey of Schrödinger Bridge (Part II)

こんにちは、CTO室リサーチャーの長山と申します。

モルフォでは毎週金曜日に持ち回りで論文紹介等を行うJournal Clubという取り組みを行っています。 今回は、前回執筆した Schrödinger Bridge Part I techblog.morphoinc.com の続編として、 Part II をお届けします。 詳細についてはスライド*1をご覧ください。

Part Iでは、Schrödinger Bridge (SB) 問題の基本的な定式化と理論的背景について解説しました。 今回のPart IIでは、SB問題を解くための3つの主要アプローチに焦点を当て、それぞれの特徴や最新の発展について詳しく見ていきます。

1. Iterative Proportional Fitting (IPF)

Part Iで述べたように、SB問題の解は2つの確率分布を繋ぐ前進過程と後退過程で表現できます。

Iterative Proportional Fitting (IPF)は、これらの過程それぞれに対応する損失関数を構成し、交互に最適化することでSB解を求めるアプローチです。

このアプローチの代表的な実現には、以下のようなものがあります:

IPFベースの手法は理論的な裏付けが強固で、収束性が数学的に保証されている点が大きな強みです。

2. Flow Matching with Minibatch Optimal Transport

DDPM などの典型的な拡散モデルは、理論上は確率微分方程式 (SDE) で記述されますが、サンプリング段階では同じ周辺密度を持つ常微分方程式 (確率フローODE) を利用することが一般的です。

Flow Matching (FM) は、この確率フローODEのベクトル場を直接学習する手法です。これにミニバッチ最適輸送 (Minibatch OT) を組み合わせることで、SB問題に対する計算効率の高い解法が実現できます。

このアプローチの注目すべき実現としては、以下のようなものがあります:

特に[SF]²Mは、決定論的な成分と確率的な成分の両方をモデル化することで、多様性のあるサンプル生成を実現しています。

3. Iterative Markovian Fitting (IMF)

SB問題の解は、Markov性 (未来の状態が現在のみに依存する性質) とReciprocal性 (端点条件に依存する性質) を同時に満たす確率過程として特徴付けられます。

Iterative Markovian Fitting (IMF) は、これら2つの性質を持つ空間への交互射影によって解を求める比較的新しいアプローチです。

このアプローチの代表的な実現には、以下のようなものがあります:

  • Diffusion Schrödinger Bridge Matching (DSBM) - IMF の交互射影を、更に前進・後退過程に対して交互に適用することで誤差累積を抑制
  • α-DSBM - DSBM に含まれる部分最適化問題を逐次更新に置き換えることで、計算効率の大幅な向上を実現

特にα-DSBMは、DSBM同等の生成品質を維持しながら訓練速度を劇的に向上させた点で注目に値します。

各手法の比較と展望

これら3つのアプローチは、それぞれ異なる特性を持っています:

アプローチ 強み 課題
IPFベース 理論的背景が強固
収束性が保証されている
高次元データでの精度に課題
FMベース 計算効率が高い
実装が比較的容易
完全なSB解には追加の工夫が必要
IMFベース 高次元データでの精度が高い 実装が複雑

機械学習研究の急速な発展により、これらの手法は継続的に改良されています。特に注目すべきは、α-DSBMのような最新手法では、計算効率と生成品質のバランスが大幅に改善されている点です。

今後は、これらの手法の大規模データへの適用や、より複雑なデータ構造 (3D、時系列データなど) への応用が進むことが期待されます。また、生成AIの分野だけでなく、科学計算や物理シミュレーションなど幅広い領域での活用も検討されています。

www.docswell.com

*1:余談ではありますが、本スライドは組版ソフトの Typst と、プレゼンテーション用パッケージの Touying を用いて作成されました。リアルタイムプレビュー可能な LaTeX のような趣なので、エンジニアの方々にはおすすめです。