後段タスクの精度向上のためのマルチレベルな分かち書きの最適化

小田倉 史麿

16:10 〜 16:30

[3C4-GS-6-03] 後段タスクの精度向上のためのマルチレベルな分かち書きの最適化

〇小田倉史麿¹、若林啓¹ (1. 筑波大学)

キーワード：分かち書き、テキスト分類、特徴表現学習、フレーズ埋め込み

分かち書きは，後段タスクの精度に影響を与えることが知られている．平岡らは，後段タスクの精度を向上させるように分かち書きを最適化する手法であるoptok4atを提案した．しかし，optok4atで用いられている分かち書きモデルは一種類であり，教師なし学習によって語彙が形成されるため，低頻度だが重要であるフレーズを見落としてしまい，十分に精度を発揮できない懸念がある．本稿では，後段タスクの精度向上を目的とした，マルチレベルな分かち書きの最適化手法を提案する．提案手法は，異なる語彙を持つ2つの分かち書きモデルの出力を連結して後段モデルに入力する．教師なし学習による分かち書きモデルだけでなく，頻出のフレーズを語彙に含む辞書ベースの分かち書きモデルを併用することで，後段モデルの精度向上を試みる．いくつかのテキスト分類タスクにおける実験によって，提案手法はフレーズを分かち書きするにもかかわらず，精度の向上に寄与しないことが確認された．

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

講演情報

[3C4-GS-6] 言語メディア処理：一般

[3C4-GS-6-03] 後段タスクの精度向上のためのマルチレベルな分かち書きの最適化

パスワード