13:20 〜 13:40
[4M2-OS-14b-05] 主観的記述の意味的類似性にもとづく画像生成
キーワード:ヒューマンコンピュータインタラクション、画像生成
人は頭の中のイメージやアイデアなどの抽象的な情報を、形や色といった客観的な情報に加え、質感や印象などの主観的な情報も含めて言語で伝達する。しかし、既存の画像生成モデルでは主観的な言語情報を十分に扱っておらず、ユーザが思い描くイメージとモデルに適したプロンプトが乖離しやすい。その結果、望みどおりの画像を得るためには、何度もプロンプトを修正する必要があり、時間と認知負荷の増大につながる。本研究では、ユーザが抱く主観的な印象言語を画像生成プロセスの評価に直接取り込む新たな手法を提案する。具体的には、ユーザが与えた主観的プロンプトと、生成画像から再生成される主観的印象テキストとの意味的類似性に基づき、生成画像の適合性を評価する。人間実験を通じて生成画像の質および期待する画像が得られるまでの試行回数を検証し、本手法の有効性を示した。
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。