13:45 〜 15:15
[O11-P26] 飛翔体打ち上げのための機械学習を用いた高層風予測
キーワード:高層風、予測、機械学習、飛翔体
1 研究の背景と目的
ロケットや気球などの飛翔体打ち上げ時には,正確な軌道計算と安全評価を行うために,局所的な地域における数日先までの高層データが必要である.これらのデータは,現地の限られた設備で迅速かつ低コストに取得できることが望まれるが,現状では打上げ当日のラジオゾンデの観測データを基に軌道計算を行っており,直前まで打上げ/延期の判断ができない.事前に予測する場合,例えば天気予報のように大規模な数値シミュレーションを行う方法が考えられるが,計算の格子間隔が広く局所的な結果が得られない上に,計算コストも大きくなる.本研究では,ロケットや気球の打上げ計画時において,事前に局所的な高層風予測を低コストで行うため,機械学習を用いた気象データからの高層風の予測に挑戦した.
2 方法
2-1 気象データの取得と整形
米国のワイオミング大学が公開している高層大気観測データサイト(Upper Air Observations)[1]から大型液体ロケット打上げ地域である,鹿児島県鹿児島市のデータセットを取得した。本研究では,2023年10月1日から2024年9月30日における1年分のデータセット(696回分の観測データ)を使用した .
データセットには,日時と場所,気圧,高度,気温,露点温度,相対湿度,比湿(大気中の水蒸気量の比率),風向,風速,温位,相対温位,および仮温位が含まれており[2],データセットごとに計測数(すなわち気圧の数)が異なる.また,地点によっては,一日2~4回分(0,6,12,18時のいずれか)のデータセット(計707セット)が存在する.それらのうち、データ数が極端に少ない6時と18時のデータと、高層のデータが欠損している露点温度,相対湿度,比湿,相対温位は除いた.その後,後述の機械学習ライブラリScikit-learnが読み込めるデータ形式に整形した.図1に,整形したデータセット一式の構成を示す. 入力日数(m)と出力日数(n)への依存性を調べるため,プログラミング言語Pythonを用いて m+1日分のデータを含む配列データセットを作成した.
2-2 機械学習プログラムの作成と実行
データ解析にはプログラミング言語Pythonを使用し,機械学習ライブラリにはScikit-learn [3]を使用した.入力には上記の大気観測データ(数値)から予測値を得るため,回帰の機能(predictメソッド)を利用した.図2に,機械学習プログラムの概要を示す.教師データとして予め準備した入力データセット(m日分のデータ)と出力データセット(n日後のデータ)の組み合わせ(整形データからランダムに選んだ87.5%)を線形モデルまたはリッジ回帰を用いて学習させた.テストデータ(残りの12.5%)の入力データから出力データを予測し,その予測データ,実際の出力データ(実測データ),および評価データをグラフ作成用に加工してCSVファイル形式で出力させるプログラムを作成,実行した.
2-3 予測精度の評価
項目ごと(気圧,高度,気温,風向,風速,温位,および仮温位)に予測精度を評価するため,機械学習プログラムに平均二乗誤差(RMSE)と平均絶対パーセント誤差(MAPE)を実装した.
3 結果と考察
表1に,1.5日分の入力データから半日後の予測を行った場合の条件別の評価結果を示す.まず,1列目と2列目を比較すると,0時のデータのみ使う場合よりも12時のデータも使った場合の方が予測精度は良くなったことが分かる.次に,2列目と3列目を比較すると,線形回帰モデルよりRidgeモデルの方が予測精度が高いことが分かる.
そこでRidgeモデルを使って,1.5日分の0,12時のデータからn日後予測のnへの依存性を調べた.その結果,n≤15では予測精度がほぼ変わらなかったが,それ以降は悪化する傾向が見られた.さらに,nを15日に固定し,入力データの日数mへの依存性を調べた.その結果,m≤30では予測精度が改善していったが、それ以上になると悪化した。これは入力データ数mが増えると使える教師データの数が減ってしまうため、m≤30では全体のデータ数に対して教師データの日数が少ないためではないかとも解釈できる.したがって,将来的には使用データ数を一年分よりも増すことで予測精度の改善に挑戦したい.
4 結論と今後の展望
ロケットや気球などの飛翔体打上げ計画における軌道予測精度向上を目的として,機械学習を用いて気象データからの鹿児島市の高層風予測に挑戦した.Ridgeモデルを用いて0時と12時のデータから予測したところ,n日後の予測ではn≤15までは予測精度が安定した.また,m日分の入力データを用いた場合,m≤30で精度が改善したが,それ以上では改善しなかった.これは教師データ数の減少と解釈できるため.今後は使用データ数を増やすことでさらなる精度向上が期待できる.
謝辞
本研究では,新潟大学 飯田佑輔准教授に評価手法および考察等について助言を頂きました.また,渋谷教育学園幕張高等学校 篠塚未暁教諭にもお世話になりました.心よりお礼申し上げます.
参考文献
[1] Upper Air Observations, Wyoming Weather Web, University of Wyoming,
https://weather.uwyo.edu/upperair/sounding.html
[2] Description of Sounding Columns, Wyoming Weather Web, University of Wyoming,
https://weather.uwyo.edu/upperair/columns.html
[3] Scikit-learn (Machine Learning Python),
https://scikit-learn.org/stable/index.html
ロケットや気球などの飛翔体打ち上げ時には,正確な軌道計算と安全評価を行うために,局所的な地域における数日先までの高層データが必要である.これらのデータは,現地の限られた設備で迅速かつ低コストに取得できることが望まれるが,現状では打上げ当日のラジオゾンデの観測データを基に軌道計算を行っており,直前まで打上げ/延期の判断ができない.事前に予測する場合,例えば天気予報のように大規模な数値シミュレーションを行う方法が考えられるが,計算の格子間隔が広く局所的な結果が得られない上に,計算コストも大きくなる.本研究では,ロケットや気球の打上げ計画時において,事前に局所的な高層風予測を低コストで行うため,機械学習を用いた気象データからの高層風の予測に挑戦した.
2 方法
2-1 気象データの取得と整形
米国のワイオミング大学が公開している高層大気観測データサイト(Upper Air Observations)[1]から大型液体ロケット打上げ地域である,鹿児島県鹿児島市のデータセットを取得した。本研究では,2023年10月1日から2024年9月30日における1年分のデータセット(696回分の観測データ)を使用した .
データセットには,日時と場所,気圧,高度,気温,露点温度,相対湿度,比湿(大気中の水蒸気量の比率),風向,風速,温位,相対温位,および仮温位が含まれており[2],データセットごとに計測数(すなわち気圧の数)が異なる.また,地点によっては,一日2~4回分(0,6,12,18時のいずれか)のデータセット(計707セット)が存在する.それらのうち、データ数が極端に少ない6時と18時のデータと、高層のデータが欠損している露点温度,相対湿度,比湿,相対温位は除いた.その後,後述の機械学習ライブラリScikit-learnが読み込めるデータ形式に整形した.図1に,整形したデータセット一式の構成を示す. 入力日数(m)と出力日数(n)への依存性を調べるため,プログラミング言語Pythonを用いて m+1日分のデータを含む配列データセットを作成した.
2-2 機械学習プログラムの作成と実行
データ解析にはプログラミング言語Pythonを使用し,機械学習ライブラリにはScikit-learn [3]を使用した.入力には上記の大気観測データ(数値)から予測値を得るため,回帰の機能(predictメソッド)を利用した.図2に,機械学習プログラムの概要を示す.教師データとして予め準備した入力データセット(m日分のデータ)と出力データセット(n日後のデータ)の組み合わせ(整形データからランダムに選んだ87.5%)を線形モデルまたはリッジ回帰を用いて学習させた.テストデータ(残りの12.5%)の入力データから出力データを予測し,その予測データ,実際の出力データ(実測データ),および評価データをグラフ作成用に加工してCSVファイル形式で出力させるプログラムを作成,実行した.
2-3 予測精度の評価
項目ごと(気圧,高度,気温,風向,風速,温位,および仮温位)に予測精度を評価するため,機械学習プログラムに平均二乗誤差(RMSE)と平均絶対パーセント誤差(MAPE)を実装した.
3 結果と考察
表1に,1.5日分の入力データから半日後の予測を行った場合の条件別の評価結果を示す.まず,1列目と2列目を比較すると,0時のデータのみ使う場合よりも12時のデータも使った場合の方が予測精度は良くなったことが分かる.次に,2列目と3列目を比較すると,線形回帰モデルよりRidgeモデルの方が予測精度が高いことが分かる.
そこでRidgeモデルを使って,1.5日分の0,12時のデータからn日後予測のnへの依存性を調べた.その結果,n≤15では予測精度がほぼ変わらなかったが,それ以降は悪化する傾向が見られた.さらに,nを15日に固定し,入力データの日数mへの依存性を調べた.その結果,m≤30では予測精度が改善していったが、それ以上になると悪化した。これは入力データ数mが増えると使える教師データの数が減ってしまうため、m≤30では全体のデータ数に対して教師データの日数が少ないためではないかとも解釈できる.したがって,将来的には使用データ数を一年分よりも増すことで予測精度の改善に挑戦したい.
4 結論と今後の展望
ロケットや気球などの飛翔体打上げ計画における軌道予測精度向上を目的として,機械学習を用いて気象データからの鹿児島市の高層風予測に挑戦した.Ridgeモデルを用いて0時と12時のデータから予測したところ,n日後の予測ではn≤15までは予測精度が安定した.また,m日分の入力データを用いた場合,m≤30で精度が改善したが,それ以上では改善しなかった.これは教師データ数の減少と解釈できるため.今後は使用データ数を増やすことでさらなる精度向上が期待できる.
謝辞
本研究では,新潟大学 飯田佑輔准教授に評価手法および考察等について助言を頂きました.また,渋谷教育学園幕張高等学校 篠塚未暁教諭にもお世話になりました.心よりお礼申し上げます.
参考文献
[1] Upper Air Observations, Wyoming Weather Web, University of Wyoming,
https://weather.uwyo.edu/upperair/sounding.html
[2] Description of Sounding Columns, Wyoming Weather Web, University of Wyoming,
https://weather.uwyo.edu/upperair/columns.html
[3] Scikit-learn (Machine Learning Python),
https://scikit-learn.org/stable/index.html
