[3Xin2-60] タスクの特性を考慮した教師なしパラレルコーパスフィルタリング
キーワード:パラレルコーパスフィルタリング、テキスト平易化、機械翻訳、文法誤り訂正
本研究では,系列変換モデルの性能向上のために,タスクを問わず適用可能な教師なしパラレルコーパスフィルタリングの手法を提案する.パラレルコーパスフィルタリングは,これまで大規模なデータを利用可能な機械翻訳が主な対象であった.しかし,小規模なデータを用いて訓練できる転移学習や文脈内学習などの技術の進展にともない,近年はデータの規模に対して品質の重要性が増しつつある.そこで本研究では,訓練済みの系列変換モデルと対象タスクの評価指標または損失関数のみを用いて,任意の系列変換タスクに適用可能なパラレルコーパスフィルタリングの手法を提案する.機械翻訳,テキスト平易化,文法誤り訂正の3タスクにおいて,提案手法の有効性を確認した.
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。