2024年度 人工知能学会全国大会(第38回)

講演情報

オーガナイズドセッション

オーガナイズドセッション » OS-18 デジタル人文学とAI

[1N4-OS-18] デジタル人文学とAI

2024年5月28日(火) 15:00 〜 16:40 N会場 (54会議室)

オーガナイザ:大向 一輝(東京大学)、嘉村 哲郎(東京藝術大学)、亀田 尭宙(国立歴史民俗博物館)、中村 覚(東京大学)

15:00 〜 15:20

[1N4-OS-18-01] コプト語教育と言語復興運動を支援するための機械翻訳データセットの構築

〇宮川 創1 (1. 国立国語研究所)

キーワード:機械翻訳、コプト語、低資源言語、デジタル・ヒューマニティーズ、言語復興

この研究の目的は,コプト正教会の典礼言語で,かつ,言語復興運動がなされているコプト語ボハイラ方言の包括的な機械翻訳データセットを作成し,ユーザ・フレンドリーな機械翻訳アプリを通してコプト正教会の典礼教育および言語復興運動を支援することである.結果として,広範なコプト語ボハイラ方言テキストをデジタル化し,27,900のコプト語ボハイラ方言-英語翻訳ペアで,コプト語ボハイラ方言は400,000以上のトークンを含むデータセットを組み立てた.このデータセットは,OPUS-MTフレームワークに基づくモデルの訓練を目的として特別に設計され,正確でアクセスしやすい翻訳を容易にするためにコプト翻訳プラットフォームに統合されている.このプロジェクトは,言語保存におけるデジタルヒューマニティーズの応用を示すだけでなく,計算言語学に貴重な資源を提供し,コプト語ボハイリック方言の活性化および維持への継続的な取り組みの一環だと位置付けられる.

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード