17:15 〜 17:30
[19p-Z32-14] 材料系文書の自然言語処理用MaterialBERTの作成
キーワード:テキストマイニング、自然言語処理、BERT
数値データではなく文字データをコンピュータにより機械学習させるには、文字を数値に変換する必要がある。文字を数値に変換する方法として単語をベクトル化するのが一般的である。Googleは2018年に様々な自然言語処理に適用可能なpre-trainingモデルBERTを発表し、翻訳や要約など様々なタスクに利用されるようになった。我々は、材料系文書の自然言語処理に役立てる目的で、BERT手法を材料系論文をコーパスとして適用したMaterialBERTの作成を試みた。