2021年第68回応用物理学会春季学術講演会

講演情報

一般セッション(口頭講演)

23 合同セッションN「インフォマティクス応用」 » 23.1 合同セッションN「インフォマティクス応用」

[19p-Z32-1~15] 23.1 合同セッションN「インフォマティクス応用」

2021年3月19日(金) 13:30 〜 17:45 Z32 (Z32)

宮寺 哲彦(産総研)、横井 達矢(名大)、小山 幸典(物材機構)

17:15 〜 17:30

[19p-Z32-14] 材料系文書の自然言語処理用MaterialBERTの作成

吉武 道子1、佐藤 文孝1,2、河野 洋行1,2、寺岡 潤1,2 (1.物材機構、2.RidgeLinez)

キーワード:テキストマイニング、自然言語処理、BERT

数値データではなく文字データをコンピュータにより機械学習させるには、文字を数値に変換する必要がある。文字を数値に変換する方法として単語をベクトル化するのが一般的である。Googleは2018年に様々な自然言語処理に適用可能なpre-trainingモデルBERTを発表し、翻訳や要約など様々なタスクに利用されるようになった。我々は、材料系文書の自然言語処理に役立てる目的で、BERT手法を材料系論文をコーパスとして適用したMaterialBERTの作成を試みた。