[3Win5-72] 有価証券報告書のQAタスクにおける回答根拠となる表セル特定に向けた二値分類アプローチの提案
キーワード:有価証券報告書、表構造解析、二値分類
本論文では、有価証券報告書の内容に関するQAタスクにおいて、回答の根拠となる表セルを特定して提示する手法を提案する。提案手法は表を行と列に分割し、質問と各行列を入出力とする二値分類モデルを作成した。各行列の分類結果のスコア値を確信度とみなして確信度の高いスコアを用いて表セルの位置を特定した。また、セル内の値に関する表記揺れをT5で補正することで、回答精度を高めた。実験の結果、90%程度の高い精度でセルの特定ができ、88%の精度でセルの値の表記揺れを修正し質問文に適した回答を行うことができた。また、入れ子構造で同じ内容を複数持つ表では誤りが多い傾向が明らかになった。
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。