[4Xin1-51] 化学工学関連論文中の命名法と数式に基づく変数定義予測手法
キーワード:変数抽出、情報抽出、数式言語処理
製造業のデジタルツイン実現には物理モデルが不可欠である.しかし,高精度な物理モデルの構築には多大な労力を要する.本研究の最終目的は,文献情報から物理モデルを自動で構築する人工知能(AutoPMoB)を開発することである.本研究ではAutoPMoBの実現に向けて,変数記号と変数定義の組が正しいかどうかを判定するタスクに取り組む.化学工学関連論文の命名法と数式に着目し,BERTを用いた判定方法を提案した.様々な入力形式を用いて12個のBERTモデルを微調整し,その性能を比較した.その結果,XML形式の変数記号とUnicode形式の数式を用いたときのBERTモデルが最高性能(F1スコア0.834,正解率0.827)を達成した.また,対象とする変数記号を含む数式を用いることで変数定義抽出の性能が向上することが示された.数式の木構造などの入力形式を活用することでさらなる性能向上が期待できる.
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。