2018年度人工知能学会全国大会(第32回)

講演情報

インタラクティブ発表

一般セッション » インタラクティブ

[4Pin1] インタラクティブ(2)

2018年6月8日(金) 09:00 〜 10:40 P会場 (4F エメラルドロビー)

09:00 〜 10:40

[4Pin1-52] 読み曖昧性解消のためのデータセット構築手法

〇西山 浩気1、山本 和英1、中嶋 秀治2 (1. 長岡技術科学大学、2. NTTメディアインテリジェンス研究所)

キーワード:読み曖昧性解消、データセット構築、クラウドソーシング

我々は, 単語の読み曖昧性解消のためのデータセット構築手法を提案する.
本手法は, 複数の読み曖昧性を持つ単語の各読みに読みを1つしか持たない単語を割り当て, その単語の含まれる文を収集し, さらにその文に含まれる読みを一つしか持たない単語を元の曖昧性のある単語へ置き換える. 更に曖昧性のある単語に対応する読みをタグ付けした. 実験を通じて, 本手法は数値的にバランスの取れたデータセットであることを確認した.