低解像度の料理画像を超解像するための SRGAN の応用

永野 雄大

14:30 〜 14:50

[3A1-03] 低解像度の料理画像を超解像するための SRGAN の応用

〇永野雄大¹、菊田遥平² (1. 東京大学、2. クックパッド株式会社)

キーワード：深層学習、超解像

SRGANは超解像手法の中でも特に人間の見た目に美しい高解像度画像を生成することができる. しかし, このモデルは一定度の解像度の画像を更に超解像をする目的で考案されたもので, 過去に撮影されたノイズを含むような低解像度画像を超解像することは困難である. 過去に撮影された低解像度画像から画像の細部情報を失うことなく自然な高解像度画像を生成できることは, 我々のサービスにとって有用である. そのため, 本稿では対象を料理画像に絞る. 超解像モデルの学習はある画像とその画像を低解像度化したもののペアから情報を復元するように実施されるという構造に注目し, 我々の目的に資する2つのアプローチを提案する. 一つ目は, 低解像度化をする際に人為的にノイズを加えるという手法である. 二つ目は, ドメイン毎にデータを分けてそれぞれでモデルを学習するという手法である. 本稿で使用したのは, {牛肉, 鶏肉, 食パン, パウンドケーキ}の4種類である. これにより, 既存手法と比べ本稿の手法では定量的・定性的に自然な高解像度画像の生成結果が得られた.

講演情報

[3A1] 機械学習-深層学習(4)

[3A1-03] 低解像度の料理画像を超解像するための SRGAN の応用