[4Xin2-17] Back Translationによる小規模データセット拡張手法を用いた記述式問題自動採点モデルの構築
キーワード:深層学習、自然言語処理、BERT
大学入学共通テストにおいて記述式問題の導入が検討されるなど, 学生の思考力を問うべく記述式問題への需要が高まっている. その際の採点コストを抑えるため, 自然言語処理の手法を用いて自動採点モデルを構築する先行研究は多くあるものの, 高精度なモデルを構築するためには大規模なデータセットを構築する必要があり, 実際の採点の現場を想定した際の実現可能性が低いという現状がある. 本研究では日本語で記述された解答のデータセットを英語訳して得られた英語データセットをBack Translation(逆翻訳)の手法を用いてデータセット拡張を行う. そして, そのようにして得られたデータセットを用いてBERTの英語事前学習モデルをファインチューニングすることで, 解答の文意を反映させた分散表現を出力できる状態を目指す. 最後に, 分散表現を入力して得点を出力する分類器を構築することで, 小規模データセットから高精度な記述式問題の自動採点モデルを構築することを考えた.
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。