2023年度 人工知能学会全国大会(第37回)

講演情報

一般セッション

一般セッション » GS-6 言語メディア処理

[2E5-GS-6] 言語メディア処理

2023年6月7日(水) 15:30 〜 17:10 E会場 (大会議室 A2)

座長:本浦 庄太(NEC) [現地]

15:30 〜 15:50

[2E5-GS-6-01] 拡散過程を用いたキャプション生成性能向上への取り組み

〇平野 理子1、小林 一郎1 (1. お茶の水女子大学)

キーワード:拡散過程、キャプション生成

近年、拡散過程を用いた生成モデルが連続データ生成において非常に良い性能を達成しており、離散データ生成においても盛んに研究が進められている。本研究は、拡散過程を用いたキャプション生成の性能向上について、言語モデルと分類器の導入の検討を行った結果を報告する。 事前学習済み汎用言語モデルおよび分類器のそれぞれの導入の有無において、精度の違いを検証し、どのような条件において精度の高いキャプション生成が実現可能かについて調査を行う。

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード