09:20 〜 09:40
[4J1-GS-6d-02] 日本語形態素解析器の知識蒸留
キーワード:自然言語処理、形態素解析、深層学習
本稿は、知識蒸留を用いて日本語形態素解析器rakkyoをさらに圧縮する手法を提案する.
日本語形態素解析器は現在非常に高い精度となっている.しかし、実用化においてはモデルサイズの大きさという課題が残されている.
そこでArsenyらによるrakkyoモデルでは、Juman++によって作成された5億文のシルバーデータを学習し、文字ユニグラムのみを用いることでモデルサイズを大幅に圧縮した.
本研究では、深層学習モデルの圧縮手法の1つである知識蒸留をすることで、rakkyoをさらに圧縮し大規模なデータを必要としない形態素解析器を構築し、小規模なデータでrakkyoの精度に近づけるかを評価した.
日本語形態素解析器は現在非常に高い精度となっている.しかし、実用化においてはモデルサイズの大きさという課題が残されている.
そこでArsenyらによるrakkyoモデルでは、Juman++によって作成された5億文のシルバーデータを学習し、文字ユニグラムのみを用いることでモデルサイズを大幅に圧縮した.
本研究では、深層学習モデルの圧縮手法の1つである知識蒸留をすることで、rakkyoをさらに圧縮し大規模なデータを必要としない形態素解析器を構築し、小規模なデータでrakkyoの精度に近づけるかを評価した.
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。