[1Win4-74] Manga109Script: 漫画レイアウト生成モデルのための脚本データセット
キーワード: 大規模言語モデル、レイアウト生成、漫画
人間の創造的営みにおいて,レイアウトの巧みな設計は重要な役割をもつ.効果的なレイアウトは作品に視覚的魅力を与え,読者の興味を引き付ける点で意義深い.この原理は様々な表現媒体に適用されるが,漫画においては物語を反映する点において特異なレイアウトをもつ.漫画のレイアウトは,脚本に基づきネームと呼ばれる下書きの中で定められ,物語の魅せ方を左右する演出として機能する.これまでレイアウトを生成するモデルの研究はWeb UIなどを対象に発展してきたが,データの不在から,脚本に基づくレイアウトの生成はこれまでに取り組まれてこなかった.そこで本研究では,Manga109データセットに含まれる約2万ページ分の脚本データを作成し,脚本と漫画レイアウトを結びつけたデータセットManga109Scriptを構築した.このデータセットを活用し,複数のLLMをベースモデルに言語情報である脚本を直接の入力とする漫画レイアウト生成モデルを開発した.これらのモデルについて,既存のレイアウト生成モデルや脚本の有無による評価を網羅的に実施し,脚本に基づくレイアウト生成,Script2Layoutのベースラインを整備した.
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。