2024年度 人工知能学会全国大会(第38回)

講演情報

一般セッション

一般セッション » GS-6 言語メディア処理

[2G5-GS-6] 言語メディア処理:

2024年5月29日(水) 15:30 〜 17:10 G会場 (22+23会議室)

座長:牧田光晴(LINEヤフー株式会社/SB Intuitions株式会社)

16:10 〜 16:30

[2G5-GS-6-03] 日本語の仮名表記を学習した言語モデルを用いた文章の言い換えによる駄洒落の生成

〇南 智仁1、清 雄一1、田原 康之1、大須賀 昭彦1 (1. 電気通信大学)

キーワード:人工知能、自然言語生成、巨大言語モデル、ユーモア

駄洒落は,音韻的に類似しながらも意味の異なる単語を組み合わせて文章を形成する言葉遊びである.駄洒落を作るには,単語の意味と発音に対する深い理解が必要となる.本研究では学習済み言語モデルに対し,日本語の読みを考慮したファインチューニングを行うことにより,日本語の文章を意味を変えずに駄洒落に変換するモデルを構築する.振り仮名注釈付きコーパスと駄洒落データベースを活用して言語モデルをファインチューニングし,日本語の読み方の理解と駄洒落作成への応用能力をモデルに与える.実験の結果,日本語の読み方を理解していないモデルを駄洒落データセットでファインチューニングした場合と比べ,提案手法は BLEU スコアが 0.03 ポイント改善した.

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード