[3Xin4-14] 専門家が平易化した記事を用いたやさしい日本語パラレルコーパスの試作
キーワード:やさしい日本語、テキスト平易化
テキスト平易化とは、難解な文を意味を保持したまま、より平易な文に変換するタスクのことである。本タスクにおける日本語の既存のパラレルコーパスは、学生やクラウドワーカーが書いた平易な文から構築されており、専門家が書いたパラレルコーパスは存在しない。我々は、専門家が平易化した記事に対して人手でアライメントをとってパラレルコーパスを構築する。本論文では、現在構築中のコーパスの一部について分析を行った結果を報告する。人手評価の結果、我々のコーパスは多様な平易化操作を含み、既存のコーパスよりも平易な文で構成されていることを確認した。
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。