16:30 〜 16:45
[MGI28-05] 非正規性に基づく地球化学データ解析の有用性
★招待講演
キーワード:非正規性、独立成分分析、クラスタリング、射影追跡、多変量解析、地球化学データ解析
20世紀以降の分析化学の発展は,様々な地質試料から多元素の情報を短時間で効率的に取得することを可能にした.その帰結として,現代における地球化学データの蓄積は増加の一途を辿っている.特に近年においては,計算機の演算処理能力の飛躍的な増大と相まって,大規模/高次元地球化学データから有用な情報を抽出しようとするデータ駆動型のアプローチが精力的に展開されている.こうした試みの最終的な目的は,自然界から得られる多種多様なサンプルに刻まれた,それらの起源物質やその形成に関与した物理化学プロセス (環境) の情報を紐解くことにある.これは,自然界における「結果」として我々が得ることのできる観測データのみを用いて,未知の割合で混合した複数の原信号を推定するという問題であり,信号処理分野では「暗中信号源分離」(Blind Source Separation, BSS) 問題として知られている.すなわち,地球化学データ解析の本質は,BSS問題を解くことと言い換えることができる.
本講演では,BSS問題の解法の1つとして,データに内在する「非正規性」に着目し,高次元のデータに隠れた構造を明らかにする「独立成分分析」(Independent Component Analysis, ICA) の概念と原理・アルゴリズム[1] を解説する.そして,講演者らが取り組んできた地球化学データ解析へのICAの適用によって得られた成果を紹介する [2-4].また,ICAのアルゴリズムは,教師なしクラスタリングにおいて最もデータ構造の特徴を掴みやすい可視化を行うための「射影追跡」(projection pursuit) と呼ばれる手法とも関連が深い.これを応用した最近の成果 (遠洋性粘土に内在する高次元化学層序の構築 [5]) についても触れる.最後に,組成データ解析において未解決の課題である定数和制約問題との関連や,本手法の限界についても議論する.
[1] Hyvärinen et al. (2001) Independent Component Analysis. [2] Yasukawa et al. (2016) Scientific Reports 6, 29603. [3] Yasukawa et al. (2017) Scientific Reports 7, 11304. [4] Yasukawa et al. (2022) Chemical Geology 614, 121184. [5] Yasukawa et al. (2023) Paleoceanography and Paleoclimatology 38, e2023PA004644.
本講演では,BSS問題の解法の1つとして,データに内在する「非正規性」に着目し,高次元のデータに隠れた構造を明らかにする「独立成分分析」(Independent Component Analysis, ICA) の概念と原理・アルゴリズム[1] を解説する.そして,講演者らが取り組んできた地球化学データ解析へのICAの適用によって得られた成果を紹介する [2-4].また,ICAのアルゴリズムは,教師なしクラスタリングにおいて最もデータ構造の特徴を掴みやすい可視化を行うための「射影追跡」(projection pursuit) と呼ばれる手法とも関連が深い.これを応用した最近の成果 (遠洋性粘土に内在する高次元化学層序の構築 [5]) についても触れる.最後に,組成データ解析において未解決の課題である定数和制約問題との関連や,本手法の限界についても議論する.
[1] Hyvärinen et al. (2001) Independent Component Analysis. [2] Yasukawa et al. (2016) Scientific Reports 6, 29603. [3] Yasukawa et al. (2017) Scientific Reports 7, 11304. [4] Yasukawa et al. (2022) Chemical Geology 614, 121184. [5] Yasukawa et al. (2023) Paleoceanography and Paleoclimatology 38, e2023PA004644.