09:00 〜 10:40
[4Pin1-52] 読み曖昧性解消のためのデータセット構築手法
キーワード:読み曖昧性解消、データセット構築、クラウドソーシング
我々は, 単語の読み曖昧性解消のためのデータセット構築手法を提案する.
本手法は, 複数の読み曖昧性を持つ単語の各読みに読みを1つしか持たない単語を割り当て, その単語の含まれる文を収集し, さらにその文に含まれる読みを一つしか持たない単語を元の曖昧性のある単語へ置き換える. 更に曖昧性のある単語に対応する読みをタグ付けした. 実験を通じて, 本手法は数値的にバランスの取れたデータセットであることを確認した.
本手法は, 複数の読み曖昧性を持つ単語の各読みに読みを1つしか持たない単語を割り当て, その単語の含まれる文を収集し, さらにその文に含まれる読みを一つしか持たない単語を元の曖昧性のある単語へ置き換える. 更に曖昧性のある単語に対応する読みをタグ付けした. 実験を通じて, 本手法は数値的にバランスの取れたデータセットであることを確認した.