第25回画像センシングシンポジウム

オーガナイズドセッション

実応用から基礎まで画像センシングの新しい活用事例&技術革新を俯瞰します.それぞれのオーガナイズドセッションのトピックは,同じ日に開催されるチュートリアル講演とリンクしています.より広く,深く学べる SSII2019 オーガナイズドセッションにご注目ください.


OS1
ビジョン & ランゲージ
〜「意図」をどのようにモデリングするか? 〜​
6/12(水) 16:00〜17:30

オーガナイザー:牛久 祥孝 氏(オムロンサイニックエックス)​

概要:いま、ビジョン&ランゲージという分野が脚光を浴びています。画像の内容を言葉で説明する画像キャプション生成を皮切りに、視覚情報と言語の有機的なつながりを理解する実に多様な研究が進められています。このセッションでは、ビジョン&ランゲージを構成する諸分野の第一人者をお招きしました。最新動向のご紹介と総合討論から、視覚情報と言語に内包される「意図」をキーワードとした体系化を図るとともに、この分野の魅力的な将来を議論したいと考えています。

講演

文字情報に潜む意図を探る

登壇者:内田 誠一 氏(九州大学)​

概要:我々は日々文字に囲まれており、それら全ては人為的すなわち意図的に提示されている。この意図には様々なタイプがある。文字列が記述している内容そのものを伝えたいという意図(メッセージ)以外にも、文字列が貼付されている物体を説明したいという意図(ラベル)、そして文字のデザインにより雰囲気を伝えたいという意図もある。本講演では、こうした文字情報提示者の意図解析に関する試みを紹介し、文字情報と人間のインタラクションのこれからを考えたい。

 

動画からの意図理解のこれまでとこれから

登壇者:大谷 まゆ 氏(サイバーエージェント)

概要:深層学習の成功により、動画像から意味を推定する手法は大きな発展を遂げました。特に画像に関する質問に答えたり、自動で映像編集をしたりといった、あたかもシステムが見た内容を理解しているかのような振る舞いは、人工知能ブームを盛り上げた一因でしょう。しかし、そのようなシステムは実際のところ「何を見て」、「何を理解」しているのでしょうか。今回は画像・映像理解研究のこれまでの取り組みと、複雑化するタスクから実際に何ができるようになったのかを事例をふまえて概説します。最後にこれまでの意味理解を超えて、動画からの意図理解を目指す試みについて議論します。

 

ビジョン&ランゲージによる意図理解と曖昧性解消

登壇者:小林 颯介 氏(Preferred Networks)​

概要:機械が人間の指示に基づいてインタラクティブに作業するためには人間の意図を正しく理解する必要がある。しかし、意図の解釈の曖昧性や不良設定性などから精度が低下しやすいため、対話で複数の入力を得ることや複数のモダリティ情報を活用することが応用上有用なアプローチとなる。本講演では、ロボットへの指示の参照表現解析などの我々の取り組みを紹介するとともに、言語、音声、画像などの情報を相互活用(マルチモーダル処理)する意図理解の研究を概説する。

 

OS2
マルチモーダル4Dセンシング
〜 リアルワールドのデジタル化 〜​
6/13(木) 10:35〜12:05

オーガナイザー:櫻田 健 氏(産業技術総合研究所)​

概要:自動運転や AR、サービスロボットなどの発展に伴い、空間モデリングの技術開発が加速しています。私たちの暮らすこの現実世界を様々な側面からデジタル化し、時間・空間的な流れを最適化することで、ビジネスと生活の両面において新たな価値を生み出すことができます。その代表的な技術が Simultaneous Localization And Mapping (SLAM) であり、カメラや LiDAR、赤外線、音波、ミリ波、マイクロ波など多様なセンサを用いた技術の研究・開発が行われています。本セッションでは、各分野の第一線で活躍されている講師をお招きして、空間モデリングの最新技術から応用例まで、オープンソースなどを交えて紹介し、今後の発展について議論していきます。

講演

ロボティクスにおける SLAM 手法と実用化例

登壇者:原 祥尭 氏(千葉工業大学)

概要:移動ロボットの自律走行を目的として、SLAM の研究が発展し、様々な手法が提案されてきた。LIDAR を用いた Laser SLAM やカメラを用いた Visual SLAM などのアプローチがある。本講演では、ロボティクスの視点で SLAM 手法を分類して位置付けを整理する。また近年、複数の手法がオープンソースとして公開されている。自律移動ロボットにおける、これらの使用例についても述べる。さらに、実際の製品での SLAM の実用化も進みつつある。各社のロボット掃除機を例として、公開情報に基づき紹介する。

 

3次元・マルチモーダル音環境認識

登壇者:坂東 宜昭 氏(産業技術総合研究所)

概要:近年の深層学習の発展とともに、音声認識をはじめとした音イベントの認識は圧倒的な性能を達成しつつある。また、遮蔽物を迂回し伝搬する特性を活用した環境認識・計測のため、音源位置(方向)の定位などが広く研究されている。このような認識と定位の結果を SLAM 技術と統合し空間的な音源地図推定を行ったり、音響情報と視覚情報と統合して教師なしで認識や分離を学習したりする研究が盛んである。さらに、これらの一部はオープンソース・ソフトウェアとして公開もされており、手軽に利用できつつある。本講演では、音環境の認識や3Dセンシングといった音響信号処理技術について、分類と位置づけを行いながら解説する。

 

エンドユーザー向け SLAM 技術の現在

登壇者:武笠 知幸 氏(楽天技術研究所)​

概要:ARKit や ARCore の登場以降、AR や SLAM のコモディティ化が進んでいるが、より高次の空間認識や3次元形状復元、それらに基づく視覚化は未だ本格的なビジネス応用には至っていない。本セッションでは、これらの技術の潜在的可能性を念頭に、最新技術動向を概観し将来を展望する。技術的課題やプロダクト化・サービス化の課題の検討にあたっては、楽天技術研究所での取り組み、特に空間的に疎な特徴点情報から密な3次元形状を得る試みや、文字認識や物体認識等との統合による画像からのインドアシーン復元などを紹介する。

 

OS3
深層学習の高速化
〜 高速チップ、分散学習、軽量モデル 〜​
6/14(金) 10:35〜12:05

オーガナイザー:中村 晃一 氏(Idein)​

概要:深層学習技術の活用が進むにつれ、学習・推論の高速化を目的とした新たなハードウェアやソフトウェア技術が次々に登場しています。コストの削減、精度の向上、研究開発の加速など、様々な観点で高速化技術を保有する事は今後の競争において重要となります。本セッションでは深層学習の高速化についてその目的やアプローチについて概観した後、高速チップ、分散学習、軽量モデルの各テーマについて講師の皆様をお招きして解説を頂きます。最後に本分野の最新動向や今後展望について議論したいと思います。

講演

カンブリア紀を迎える深層学習チップ
~現状の概観と今後の展開について~

登壇者:須藤 武文 氏(さくらインターネット)

概要:よく、深層学習には計算資源が沢山必要になると言われます。事実、企業や国研等は急ピッチで学習用の計算資源を整備しており、そこには多額の資金が投じられています。競争に勝つため、より大量の学習を、より高速に、より安価に行いたい。この要求に応えるため、多種多様な深層学習用の半導体開発も同時多発的に始まり、あたかもカンブリア紀的様相を呈するようになりました。本講演ではこの状況について概観し、今後の展開について論じます。

 

深層学習にかかる時間を短くしてみませんか?
~分散学習の勧め~

登壇者:田中 義己 氏(Sony)

概要:深層学習がAI開発に広く使われていますが、学習時間は年々長くなっています。その解決方法の1つとして複数のGPUやマシンを利用した分散学習があります。しかし、分散学習による効果が不明瞭だったり、導入ハードルが高いと思われがちだったりします。本講演では、世の中の分散学習の事例と効果について紹介し、それを支える分散学習の高速化技術や学習収束技術について説明します。また、分散学習を簡単に始められる方法についても紹介します。

 

モデル高速化百選

登壇者:内田 祐介 氏(DeNA)

概要:深層学習の高速化は、モデルの訓練時・推論時どちらにおいても実応用上非常に重要な技術となります。本講演では、ハードウェアやフレームワークにあまり依存しない、モデルレイヤにおいて実現可能な高速化技術を、軽量なモデル設計、枝刈り、量子化、蒸留等に分類し、解説します。また、完成したモデルの特定ハードウェアに向けた最適化手法についても紹介します。