11:15 〜 11:30
[22a-M206-9] テキストデータマイニングによる超伝導データベースの構築と機械学習Ⅱ
キーワード:超伝導、機械学習、データマイニング
圧力下超伝導の探索に機械学習を用いる際、教師データの収集から行う必要があり、我々は文書データから超伝導物質の組成・Tc・圧力をデータマイニングするgrobid-superconductorsに26万報論文を読ませ、データを抽出した。クレンジング前後の組成・Tc・圧力の3つが紐づいたデータをそれぞれ作成し、単回帰分析を行いTc予測モデルを作成した。クレンジング前後の両者の比較から、機械学習に用いる場合のクレンジングの重要性について議論する。