招待インタラクティブ発表
招待インタラクティブ発表は、実行委員会が画像関連技術における注目の取り組みをセレクトし、インタラクティブセッションにてご発表いただく企画です。発表のコアタイムは各日のインタラクティブセッションです。各分野でご活躍の発表者と直接ディスカッションができるチャンスですので、どうぞお楽しみに!
-
IS1 6/14 (水) 14:35〜16:20
-
IS2 6/15 (木) 15:50〜17:35
-
IS3 6/16 (金) 14:25〜16:10
今後の動向予想

発表者:箕浦 大晃 氏
(中部大学)
概要: ImageNetによる画像認識タスクにおいてConvolutional Neural Network (CNN)が長い間デファクトスタンダードモデルとして利用された。CNNを凌駕する性能を発揮したVision Transformer (ViT)が登場した2021年以降、ViTベースの手法が様々なコンピュータビジョンタスクで飛躍的発展を見せている。一方で、その勢いのあまり類似研究が多数でどこにフォーカスするかが重要になる。このような背景のもと、本講演ではViTの応用例をまとめつつ今後のViT周辺に関する動向予想について紹介する。
実行委員からの紹介:登場以来勢いが止まることのないViTの発展は追い切るのが難しいほどになっています。本発表では、「Vision Transformer入門」の執筆にも携わられた箕浦様をお招きし、ViTの応用や今後の動向についてまとめてご紹介いただきます。ご期待ください!
周辺分野の研究動向

発表者:三鼓 悠 氏
(NTTコミュニケーション科学基礎研究所)
概要:機械学習では、訓練データのドメインとテストデータのドメインが同じと仮定されることが一般的だが、実際にはこの仮定が成り立たないことも多く、これによって機械学習システムの性能が大きく損なわれることがある。実用上避けては通れないこの問題に対する解決策の一つが教師なしドメイン適応と呼ばれる技術である。本発表では、教師なしドメイン適応に関する様々な派生問題を統一的に扱う枠組みである「一般化ドメイン適応」について解説するとともに、周辺分野の近年の研究動向について紹介する。
実行委員からの紹介:機械学習を幅広いアプリケーションで実用する上ではデータのドメインを考慮することが必要不可欠となってきます。本発表では、「コンピュータビジョン最前線 Autumn 2022」でドメイン適応の解説記事を執筆された三鼓様に、一般化ドメイン適応の基礎と最新の研究動向についてご紹介いただきます。ご期待ください!
生成について

発表者:下田 和 氏
(株式会社サイバーエージェント)
概要:近年の広告画像はデザイナーによりVector形式のフォーマットで制作されるのが一般的である。Vector形式の画像についての研究はデザイナーの制作支援といった観点から有用であることが期待できるが、Raster形式の画像に関する研究と比較して、Vector形式の画像に関する研究は深く取り組みが行われていない。本稿では広告画像における応用を見据えた研究として、テキストのVector情報に関連する研究を紹介する。特に、Raster画像のテキストをVector画像として再構成する手法、Typography情報が未設定であるテキストに対してVector形式のTypography情報を自動で生成する手法の二つを紹介する。
実行委員からの紹介:広告・デザイン分野の現場では欠かせないVector形式のデータ、特にテキストデータは普段意識せずともWebページや論文のPDFなど日常的に触れていることかと思います。本発表では、広告画像における応用を中心にテキストVectorデータを扱う研究について、数多くの研究業績を挙げられている下田様にご紹介いただきます。ご期待ください!