2022年度 人工知能学会全国大会(第36回)

講演情報

一般セッション

一般セッション » GS-6 言語メディア処理

[4D3-GS-6] 言語メディア処理:応用

2022年6月17日(金) 14:00 〜 15:40 D会場 (Room D)

座長:伊藤 友貴(三井物産)[現地]

14:00 〜 14:20

[4D3-GS-6-01] 画像キャプション生成に基づく描画内容に即した駄洒落文の選択手法

〇浅野 歴1、谷津 元樹1、森田 武史1 (1. 青山学院大学)

キーワード:画像キャプション生成、ユーモア

ソーシャルロボットが画像入力より得られる周辺状況に基づいた発話を行う際,駄洒落等のユーモアを付加できれば,エンターテインメント性が向上すると考えられる.そのため,本研究では既存のキャプション生成モデルやオブジェクト検出を活用し画像に合った駄洒落文を選択するためのランキング手法を提案する.提案手法では, STAIR Captionデータセットより学習した日本語キャプション生成モデルよりプレーンキャプションを生成し、得られたキャプションから重要語及び他の形態素を抽出する.このようにして得られた単語に対して,物体検出及び重要語抽出の結果の語がより大きな値を持つように重み付けする.出力として駄洒落データベースにおいて重みの和が最大となる駄洒落文を選択する.主観評価実験では,MSCOCOデータセットからランダムに選択した10枚の画像に対して提案手法を用いて各画像に合った駄洒落文を選択し,10名の被験者に「駄洒落文が画像に対して適切であるか」を質問し,5段階評価を行ってもらった.その結果,評価値の平均は 3.11であり「どちらともいえない」を若干上回る結果が得られた.

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード