深層学習モデルの数量推論能力の評価とメタ学習活用の試み

工藤 慧音

15:30 〜 15:50

[3C4-GS-6-01] 深層学習モデルの数量推論能力の評価とメタ学習活用の試み

〇工藤慧音¹、青木洋一¹、Brassard Ana^2,1、栗林樹生^1,3、吉川将司^1,2、乾健太郎^1,2 (1. 東北大学、2. 理化学研究所、3. Langsmith 株式会社)

キーワード：記号推論、数量推論、メタ学習、深層学習

今日，自然言語処理の様々なタスクにおいてTransformerを初めとする深層学習モデルが大きな成果を上げており，数量推論等の推論タスクにおいても高い性能に到達できることが示されている．しかしながら現状の深層学習モデルが問題の構成性を捉えて，その構造に応じた推論を行ってタスクを解いているのかについては定かではない．実際は表面的な手がかりを利用した何らかのショートカットラーニングを行なっている恐れがある．そこで本研究では，数量推論タスクを抽象化した形式言語を用いて既存の深層学習モデルの推論能力の評価を行なう．また，調査を通して明らかとなった通常の教師あり学習では獲得が困難な数量推論能力を，近年モデルに構成性を理解させる上での有効性が示されているメタ学習によって獲得することができるのかについても調査を行なう．実験の結果，(1)自然言語テキスト上での事前学習が形式言語上のタスクにおける性能向上につながること (2)多段の推論を要する問題は既存の深層学習モデルにとって困難な問題であることがわかった．

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

講演情報

[3C4-GS-6] 言語メディア処理：一般

[3C4-GS-6-01] 深層学習モデルの数量推論能力の評価とメタ学習活用の試み

パスワード