16:40 〜 17:00
[1J3-GS-10e-05] 多層LSTMモデルによるトークンレベルでのPICO情報抽出
キーワード:PICO、Biomedical text、情報抽出
PICO (Population, Intervention, Comparison, Outcome) は、臨床試験や臨床研究のデザインを定義するための一般的なフレームワークである。したがって、論文からのPICO情報の抽出は各試験・研究の詳細を把握するうえで重要であり、近年、機械学習手法による自動化が試みられている。PICO情報抽出モデルは、各文章中に含まれるPICO情報をトークンレベルで抽出するタスクによって訓練されることが多く、これまでに、BERTをベースにしたモデルが最も高精度であると報告されている。
他方、PICO情報は、例えばP情報を表すトークン列中にI情報が含まれる等、互いにオーバーラップするケースがあるものの、オーバーラップしたPICO情報を同時に抽出するためのモデルはこれまで報告されていない。そこで本研究では、nested entity抽出モデルの一種である多層LSTMモデル(Pyramid)をPICO情報抽出へ適用する。本稿では、当該モデルがBERTモデルと同程度の精度でPICO情報を抽出できることを確認する。
他方、PICO情報は、例えばP情報を表すトークン列中にI情報が含まれる等、互いにオーバーラップするケースがあるものの、オーバーラップしたPICO情報を同時に抽出するためのモデルはこれまで報告されていない。そこで本研究では、nested entity抽出モデルの一種である多層LSTMモデル(Pyramid)をPICO情報抽出へ適用する。本稿では、当該モデルがBERTモデルと同程度の精度でPICO情報を抽出できることを確認する。
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。