15:30 〜 17:00
[SGD01-P12] 広く使えるベイズ情報量基準(WBIC)の適用によるGNSS-A解析ソフトウェアGARPOS-MCMCにおけるモデル評価
キーワード:GNSS-A、GARPOS、MCMC、広く使えるベイズ情報量基準(WBIC)、モデル選択
海底測地学においては,GNSS―音響測距結合方式(GNSS-A)による精密測位技術(e.g., Spiess et al., 1998; Fujita et al., 2006; Ishikawa et al., 2020)が用いられ,主に沈み込み帯周辺でプレート沈み込みに伴う地殻変動が観測されている.GNSS-Aにより海底位置を精密に決定するためには,温度等に依存する海中音速が音響往復走時に与える影響を適切に除去または補正する必要がある.Watanabe et al. (2020) は,音速の時空間変動場に自然に対応する摂動場モデルを導入し,その各項の時間的変化が滑らかになるような先験条件を課した上で摂動場自体を推定する手法を定式化した.彼らは観測方程式において線形な摂動場モデルを導入することで,平滑化強度や観測誤差の相関等を表すハイパーパラメータの下,半解析的に海底位置と摂動場パラメータを同時推定する方式を開発した.その実装となるオープンソースソフトウェアGARPOS(最新版はv1.0.1, https://doi.org/10.5281/zenodo.6414642)においては,平滑化強度やデータ誤差の相関等を制御するハイパーパラメータが赤池ベイズ情報量基準(ABIC; Akaike, 1980)を最小化するように選択される経験ベイズ的なアプローチが採用されている.
Watanabe et al. (under review, preprint https://doi.org/10.21203/rs.3.rs-1881756/v1) はGARPOSを発展させ,ハイパーパラメータ自体を確率分布として扱うことのできるフルベイズGNSS-A解析スキームを,マルコフ連鎖モンテカルロ法(MCMC)を用いて実装した(GARPOS-MCMC; 最新版はv1.0.0, https://doi.org/10.5281/zenodo.6825238).これにより,ハイパーパラメータを含めたパラメータの同時分布を直接サンプリングすることが可能となり,パラメータ間の相関も容易に評価できるようになった.さらに,フォワードモデルであるMCMCにおいてはパラメータ分布がガウス分布に従うとする仮定や観測方程式における線形性を前提とする必要がないため,より柔軟な擾乱場モデルを導入することができる.実際,Watanabe et al. (under review) では,よりシンプルで現実的な単層傾斜場モデルを導入し,どのようなケースで測位精度が向上するかについて議論している.
一方で,GARPOS-MCMCにも課題がある.一つは解析速度であり,観測誤差行列Σdの非対角成分を導入し統計的な適切性を保っているが,その形状を制御するパラメータ(μとする)の分布も推定しているため,すべてのMCMCステップでN × N(Nはデータ数)行列の逆行列計算を必要とすることが,計算コストを増大させている.また,GARPOS-MCMCでは異なる複数の擾乱場モデルで解を得ることができるが,そのうちどのモデルがより統計的に適切かといった評価を所与のデータセット内で得られない点も課題となっている.
まず前者に関し,Watanabe et al. (under review) においては,μは測位解や擾乱項といった求めるべきパラメータとの相関が小さいという結果が得られている.したがって,適切なμを選び,それを定数とした場合には解に大きな影響はないと考えられる.このようにμを定数とすれば,Σdの逆行列計算はモデルごとに1回で済むので,少ない計算コストで適切な解が得られると期待される.したがって,μ = μkとなるモデルを構築して適切なモデルを選択すると考えれば,後者の課題も含め,いずれもモデル間での評価を可能とする指標を得るという目標に還元される.
そこで本研究では,GARPOS-MCMCで許容されているような事後分布が非ガウスの場合でも近似的に計算可能な情報量基準として「広く使えるベイズ情報量基準(WBIC; Watanabe, 2013)」を採用し,モデル間の比較を行う.WBIC値は,分配関数から計算されるベイズ自由エネルギーと同じ漸近挙動を持つ値で,事後確率がガウス分布で近似できる場合に,ベイズ情報量基準(BIC)に近似できる.つまり,WBIC値が小さなモデルを選択すれば,近似的に自由エネルギーの小さなモデルを選択することになる.このWBICは逆温度が 1/log(N) の事後分布からサンプルされた尤度から求まるので,1つのMCMC系列から計算可能であり,比較的容易に値が得られる.
本発表では,まず,GARPOSの観測モデルにおける具体的なWBIC値の導出を示す.そのうえで,実データを用いて,WBIC値最小として選ばれたμとフルベイズのGARPOS-MCMCで得られたμの値を比較し,その有効性について議論する.
Watanabe et al. (under review, preprint https://doi.org/10.21203/rs.3.rs-1881756/v1) はGARPOSを発展させ,ハイパーパラメータ自体を確率分布として扱うことのできるフルベイズGNSS-A解析スキームを,マルコフ連鎖モンテカルロ法(MCMC)を用いて実装した(GARPOS-MCMC; 最新版はv1.0.0, https://doi.org/10.5281/zenodo.6825238).これにより,ハイパーパラメータを含めたパラメータの同時分布を直接サンプリングすることが可能となり,パラメータ間の相関も容易に評価できるようになった.さらに,フォワードモデルであるMCMCにおいてはパラメータ分布がガウス分布に従うとする仮定や観測方程式における線形性を前提とする必要がないため,より柔軟な擾乱場モデルを導入することができる.実際,Watanabe et al. (under review) では,よりシンプルで現実的な単層傾斜場モデルを導入し,どのようなケースで測位精度が向上するかについて議論している.
一方で,GARPOS-MCMCにも課題がある.一つは解析速度であり,観測誤差行列Σdの非対角成分を導入し統計的な適切性を保っているが,その形状を制御するパラメータ(μとする)の分布も推定しているため,すべてのMCMCステップでN × N(Nはデータ数)行列の逆行列計算を必要とすることが,計算コストを増大させている.また,GARPOS-MCMCでは異なる複数の擾乱場モデルで解を得ることができるが,そのうちどのモデルがより統計的に適切かといった評価を所与のデータセット内で得られない点も課題となっている.
まず前者に関し,Watanabe et al. (under review) においては,μは測位解や擾乱項といった求めるべきパラメータとの相関が小さいという結果が得られている.したがって,適切なμを選び,それを定数とした場合には解に大きな影響はないと考えられる.このようにμを定数とすれば,Σdの逆行列計算はモデルごとに1回で済むので,少ない計算コストで適切な解が得られると期待される.したがって,μ = μkとなるモデルを構築して適切なモデルを選択すると考えれば,後者の課題も含め,いずれもモデル間での評価を可能とする指標を得るという目標に還元される.
そこで本研究では,GARPOS-MCMCで許容されているような事後分布が非ガウスの場合でも近似的に計算可能な情報量基準として「広く使えるベイズ情報量基準(WBIC; Watanabe, 2013)」を採用し,モデル間の比較を行う.WBIC値は,分配関数から計算されるベイズ自由エネルギーと同じ漸近挙動を持つ値で,事後確率がガウス分布で近似できる場合に,ベイズ情報量基準(BIC)に近似できる.つまり,WBIC値が小さなモデルを選択すれば,近似的に自由エネルギーの小さなモデルを選択することになる.このWBICは逆温度が 1/log(N) の事後分布からサンプルされた尤度から求まるので,1つのMCMC系列から計算可能であり,比較的容易に値が得られる.
本発表では,まず,GARPOSの観測モデルにおける具体的なWBIC値の導出を示す.そのうえで,実データを用いて,WBIC値最小として選ばれたμとフルベイズのGARPOS-MCMCで得られたμの値を比較し,その有効性について議論する.