第30回画像センシングシンポジウム

オーガナイズドセッション

実応用から基礎まで画像センシングの新しい応用&技術革新について期待が高まるテーマを選りすぐり、講師の方々にご講演いただきます
 
OS1
研究紹介100連発
画像⽣成AI・⾃動運転・AI✖️ロボット・限られたデータからの学習
6/12(水)

オーガナイザー:福井 宏 ⽒
(⽇本電気株式会社)

概要:最近の画像認識は言語モデルなどの技術の進化により目覚ましいパフォーマンスを発揮していると共に、これらが導入されたAIのアプリケーションを日常で目にする機会が多くなってきました。 本セッションでは、画像認識に関連する4つのテーマから昨今のAIの動向について100個のトピックで紹介して頂きます。 各テーマの講演者から25個の研究トピックをテンポよく紹介して頂き、数多くの研究を振り返りながら最近の動向を学びます。

講演

現場の課題を解決するロボットラーニング

登壇者:濵屋 政志 氏
(オムロンサイニックエックス株式会社)

概要:本講演では、弊社の最新の研究成果をご紹介します。特に、部品組立、科学実験、調理作業におけるロボットの自動化に関する課題を共有し、これらの課題を解決するための強化学習や大規模言語モデルを使用したロボットの運動学習技術についてご紹介いたします。

 

画像生成技術の発展:過去10年の軌跡と未来への展望

登壇者:石井 雅人 氏
(ソニーグループ株式会社)

概要:画像生成技術は過去10年間で飛躍的な発展を遂げました。本講演では、その発展の歴史を俯瞰し、転換点となった重要な技術を紹介します。また、それらの技術がどのような課題を解決してきたのか、その過程に焦点を当てて解説します。この講演を通じて、画像生成技術の発展の軌跡をたどり、その先にある可能性を探ります。

画像認識におけるモデル・データの共進化

登壇者:片岡 裕雄 氏
(産業技術総合研究所)

概要:研究紹介100連発という企画に従い、自らの15年分の研究変遷を25テーマ15分に要約する。時には時流に乗り、時には反抗しながらも自らの発想を分野に提案してきた。人物行動解析から始まり、限られたデータリソースからの深層学習など、モデルとデータの関係性に着目しながら研究履歴を振り返る。

 

自動運転における重要技術とトレンド紹介

登壇者:斉藤 之寛 氏
(株式会社ティアフォー)

概要:本講演では、自動運転のオープンソースソフトウェアであるAutowareを事例に、自動運転における重要な技術を紹介します。さらに、Autowareのコミュニティでの最新の研究トレンドや実サービス化に必要な周辺ソフトウェアも幅広く紹介します。自動運転に必要な認知・判断・操作に関する研究はもちろんのこと、シミュレーターや開発を支えるシステムについても紹介します。


OS2
GPT-4Vで画像認識は終わるのか
6/13(木)

オーガナイザー:⼋⽊ 拓真 ⽒
(産業技術総合研究所)

概要:GPT-4Vの登場を皮切りに、画像認識分野においても汎用・大規模の基盤モデルが多くのタスクで専用モデルを凌駕することが示され、研究開発の方法やあり方を考え直す時期が到来しています。 GPT-4Vなどの登場によって今の画像認識分野は終わるのかという問いかけを通じて、画像認識分野が今後何を目指していくべきかを講演者・参加者の皆様と共に考える機会を提供します。

講演

大規模言語モデルとVision & Languageのこれから

登壇者:栗田 修平 氏
(国立情報学研究所)

概要:大規模なテキストデータを用いて事前学習された比較的シンプルなモデルが、テキストの意味がある程度わかっているかのように応答を行うことは驚嘆に値する。大規模言語モデルや、その変種で視覚入力等にも対応した視覚言語モデルを中心として、その特徴や研究開発動向を概説するとともに、これらのモデルの登場で今後の言語処理・画像処理研究がどのように変化していくのか、Vision & Language研究者の視点から模索する。

画像、その先へ
〜モーション解析への誘い〜

登壇者:藤原 研人 氏
(LINEヤフー株式会社)

概要:実世界には、画像という媒体のみでは表現し切れない視覚情報が存在します。 その中でも、人々の動作は様々な場面において重要な意味を持ちます。 本講演では、画像認識の先にある題材の一例として、人間のモーションデータに焦点を当てた研究事例を、LINEヤフーVirtual Human Labの取り組みを織り交え紹介します。

大規模言語モデルと基盤モデルの射程

登壇者:大谷 まゆ 氏
(株式会社サイバーエージェント)

概要:近年、基盤モデルは画像認識の多くの領域を征服してきました。 そして今度は大規模言語モデルと接続することでさらに広範なインパクトが期待されています。 一見シンプルなアプローチが大規模な学習により(おそらく多くの研究者の直感を超えて)強力なツールとなってきたことを踏まえ、 この枠組みの将来的な可能性を少し過大に期待して、画像認識は”終わる”という立場から議論を盛り上げていきたいと思います。


OS3
基盤モデル
6/14 (金) 

オーガナイザー:下⽥ 和 ⽒
(株式会社サイバーエージェント)

概要:近年大規模なデータ、モデルを活用した基盤モデルに関する技術は目覚ましい発展を遂げています。 また、基盤モデルは産業応用に関しても広い注目を集めており、多くの企業が基盤モデルの研究開発に力を入れ始めている状況です。 本セッションでは、基盤モデルを実際に開発している企業の方々をお招きし、各社で開発している基盤モデル関連の技術やノウハウについてご講演していただきます。

講演

基盤モデルとそのビジネス活用

登壇者:井尻 善久 氏
(LINEヤフー株式会社/SB Intuitions株式会社)

概要:LINEヤフーでは早期より大規模言語モデル開発を手掛けてきた。 近年では、言語のみならず、音声・画像と言語をつなぐマルチモーダル基盤モデルの開発も進めている。 講演では、これらを取り巻く技術動向を振り返るとともに、LINEやヤフーのユニークなサービスに応用される基盤モデルについて紹介する。

企業における基盤モデル開発の実際

登壇者:石上 亮介 氏
(株式会社サイバーエージェント)

概要:基盤モデルは様々なタスクに適用可能であり、企業における AI 活用の可能性を大きく広げています。 しかし、企業が自社で基盤モデルを開発するには、様々な課題があります。 本講演ではサイバーエージェントが取り組む基盤モデル開発について紹介します。 大規模言語モデル(LLM)やマルチモーダルなモデル開発における知見や苦労した点について共有し、企業における基盤モデル開発の現状と今後の展望について議論します。

生成AIと完全自動運転

登壇者:青木 俊介 氏
(チューリング株式会社/国立情報学研究所)

概要:完全自動運転実現に向けてチューリングが研究・開発する生成AI・マルチモーダルAIについて紹介します。 生成AI・マルチモーダルAIの出現に伴い、運転シーンの理解・運転行動の決定・運転データの検索システムまで大きく様変わりし、自動運転の技術領域も大きく進展しています。 本講演ではこれまで開発した世界初のLLM自動運転システム・マルチモーダルライブラリ「Heron」・生成AIを使った車両デザインを紹介しつつ、生成AIと自動運転に関する最新研究事例をアカデミックな観点から詳しくご説明します。