17:30 〜 17:50
[2E6-GS-6-01] テ形従属節の用法判定のための用法分類アノテーション
キーワード:従属節、用法分類、自然言語処理
テ形従属節は日本語に頻出する表現であり、複数の用法がある。その用法を計算機で判定することは自然言語処理分野の重要なタスクと言える。そこで本研究では、テ形従属節の用法分類とアノテーションガイドラインの設計を行った。テ形従属節の用法については日本語学分野でさまざまな分類が提案されている。しかし、それらの分類で説明された用法ごとの特徴や例文をそのまま用いてアノテーションガイドラインの作成を試みると、非専門家である作業者にとって判断が難しかったり、複数の用法がアノテーションされたりするという問題点がある。そのため本研究では言語学的テストを用いたアノテーションガイドラインを設計する。言語学的テストとは対象表現が言い換え可能かなどを判定するもので、 それによってアノテーション時の判断が揺れにくくなるとされている。アノテーション時にはガイドラインの言語学的テストを適用することでテ形従属節の出現の用法を判定し、用法タグを付与した。さらに、このようにして構築したコーパスをもとに、BERTを用いて用法判定器を学習する。
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。