2023年度 人工知能学会全国大会(第37回)

講演情報

ポスターセッション

一般セッション » ポスターセッション

[3Xin4] ポスターセッション1

2023年6月8日(木) 13:30 〜 15:10 X会場 (展示ホールB)

[3Xin4-14] 専門家が平易化した記事を用いたやさしい日本語パラレルコーパスの試作

〇惟高 日向1、山内 洋輝1、柳本 大輝1、宮田 莉奈1、梶原 智之1、二宮 崇1、西脇 靖紘2 (1.愛媛大学、2.株式会社MATCHA)

キーワード:やさしい日本語、テキスト平易化

テキスト平易化とは、難解な文を意味を保持したまま、より平易な文に変換するタスクのことである。本タスクにおける日本語の既存のパラレルコーパスは、学生やクラウドワーカーが書いた平易な文から構築されており、専門家が書いたパラレルコーパスは存在しない。我々は、専門家が平易化した記事に対して人手でアライメントをとってパラレルコーパスを構築する。本論文では、現在構築中のコーパスの一部について分析を行った結果を報告する。人手評価の結果、我々のコーパスは多様な平易化操作を含み、既存のコーパスよりも平易な文で構成されていることを確認した。

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード