2023年度 人工知能学会全国大会(第37回)

講演情報

一般セッション

一般セッション » GS-6 言語メディア処理

[2E6-GS-6] 言語メディア処理

2023年6月7日(水) 17:30 〜 19:10 E会場 (大会議室 A2)

座長:中山 英樹(東京大学) [現地]

18:50 〜 19:10

[2E6-GS-6-05] 言語学的に妥当なCCGツリーバンク構築の試み

〇富田 朝1、谷中 瞳2、戸次 大介1 (1. お茶の水女子大学、2. 東京大学)

キーワード:ツリーバンク、組合わせ範疇文法、統語解析、理論言語学

組合せ範疇文法(CCG)のパージングはCCGツリーバンクを学習・評価データにすることが多いため、言語学的に妥当なCCGツリーバンクの構築が必要である。しかし、現行の日本語CCGツリーバンクであるCCGbankでは、受身・使役の構文に対して誤った分析がなされていることが指摘されている。ABC文法のツリーバンクABCTreebankでは、項構造など多くの改善がなされたが、日本語CCGの標準的な統語素性が記述されておらず、統語情報としては不十分である。一方、CCG統語解析器lightblueの出力には標準的な統語素性が与えられているが、項構造に誤りが多いという欠点がある。本研究では、ABCTreebankが持つ利点とlightblueが持つ利点を合わせることで、より言語学的に妥当で詳細な情報を持った日本語ツリーバンクを生成する手法を提案する。ABCTreebankから得られた用言の語彙項目を用いてlightblueの語彙項目をフィルターするアルゴリズムの開発を行い、lightblueの出力を変換することで、言語学的に妥当なCCGツリーバンクを構築する。

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード