10:30 AM - 12:10 PM
[3Rin2-42] Neural Error Detection for Weather Forecast Manuscript by Pseudo Error Corpus
Keywords:NLP, GED
天気予報原稿は一般的に人手で記述されているため,誤りを含んでいる場合がある.それらの誤りは公開する前に校正する必要がある.通常これらの誤りは人手での多重チェックなど で公開前に校正されているが,この校正には大きなコストがかかっている.
そこで本研究では天気予報原稿の自動誤り検出を行う.我々は天気予報原稿の誤り傾向を分析し,天気予報原稿の誤り検出器の学習のためのコーパスを作成した.また,擬似誤りを生成してコーパスを拡充し,助詞誤りと誤変換の検出を行なった.その結果擬似誤りによる学習コーパスの拡充が日本語母語話者が記述したテキストの自動誤り検出に有用であることが分かった.
そこで本研究では天気予報原稿の自動誤り検出を行う.我々は天気予報原稿の誤り傾向を分析し,天気予報原稿の誤り検出器の学習のためのコーパスを作成した.また,擬似誤りを生成してコーパスを拡充し,助詞誤りと誤変換の検出を行なった.その結果擬似誤りによる学習コーパスの拡充が日本語母語話者が記述したテキストの自動誤り検出に有用であることが分かった.