オーガナイズドセッション
実応用から基礎まで画像センシングの新しい活用事例&技術革新を俯瞰します.それぞれのオーガナイズドセッションのトピックは,同じ日に開催されるチュートリアル講演とリンクしています.より広く,深く学べるSSII2018オーガナイズドセッションにご注目ください.
OS1: コンピュータビジョン技術の実応用とビジネス
2018年6月13日(水)16:00-17:30

オーガナイザー:内田 祐介 氏(ディー・エヌ・エー)
セッション概要:
近年、急速な発展を見せている深層学習の恩恵を受け、コンピュータビジョン技術は性能向上だけではなくビジネスの応用範囲も大きく広がりつつある。本オーガナイズドセッションでは、コンピュータビジョン技術を異なるビジネスモデルにて展開している企業の方々にご講演頂き、コンピュータビジョン技術を実ビジネスとして成功させるためには何が重要かを議論していく。
講演

顔認証から自動運転へ:勞 世竑 氏(センスタイムジャパン)
概要:
近年、中国では多くのベンチャー企業がディープランニングを活用して急成長を遂げている。特に画像認識の分野においては、ディープランニングによって顔認証の性能が人の認証能力を超えたことで、応用が広がった。一方、日本においては、画像認識技術による自動運転への期待が大きい。ディープランニング技術によって、さまざまな環境における人、車、道路の認識が可能になり、高精度な地図やGPSシステムを使わなくても、ローコストのカメラによる自動運転技術の開発が進められている。また、中国におけるディープランニングベンチャー企業の急成長の実態を紹介する。

Scaling Your Machine Learning Business:緒方 貴紀 氏(ABEJA)
概要:
コンピュータービジョンやDeep Learningフレームワークのオープンソース化や普及により、より多くの人が最先端の技術を活用したアプリケーションを開発・公開することが可能になりました。しかしながら、機械学習を活用したプロダクトを実社会でサービス化・運用するためには、システムアーキテクチャやミドルウェアの知識・メトリックの監視等、機械学習の技術以外の大量の知識や経験が必要になってきます。機械学習アプリケーションのデリバリー課題を解決するために、私たちはABEJA PlatformというAI運用Platformを開発・提供しております。ABEJAでは約6年間、最新の機械学習アルゴリズムを活用したサービスをクラウド上で提供しており、そこで培ったプロセスやノウハウをシステム化することで、機械学習を活用したい方がよりアルゴリズムの開発に注力できるような取り組みを行っております。本セッションでは、ABEJA Platformの概要やどういった課題を解決しているのかを発表させていただきます。

映像解析のビジネス活用における展望と課題:金田 卓士 氏(フューチャースタンダード)
概要:
画像認識分野における、深層学習の研究の発展を受けて、映像解析のビジネスへの応用が様々な分野で模索されているが、現状では実証実験の実施に止まり、本番の導入まで至っているケースはまだ多くないと感じている。本講演では、数々の映像解析プロジェクトに関わってきた経験から、映像解析を実導入するにあたり、どのような課題があり、その克服に向けてどのようなアプローチが考えられるのかを、複数のケースと共に紹介する。
OS2: マルチモーダル深層学習:画像認識を越えて広がる世界
~画像・自然言語・音声の共創~
2018年6月14日(木)10:35-12:05

オーガナイザー:中山 英樹 氏(東京大学)
セッション概要:
深層学習の発達により、画像・言語・音声などさまざまな分野で驚異的な性能向上が実現されましたが、同時に各分野固有の技術の多くがニューラルネットワークという共通の枠組みに包含されるようになったことで、分野間の垣根が急速に低くなってきています。このような背景から、さまざまなモダリティを横断するマルチモーダルと呼ばれる領域の研究が進み、従来は考えられなかった魅力的な技術が次々と生まれています。本セッションでは、各分野の第一線で活躍されている講師をお招きし、マルチモーダル深層学習の基礎および最新の展開を解説し、議論を深めたいと思います。
講演

自然言語による状況理解:岡崎 直観 氏(東京工業大学)
概要:
人工知能分野で発表される研究の多くに、深層学習が当然のように用いられるようになった。人工知能研究をもう一段先のレベルに押し上げるには、マルチモーダルな外界の情報(言語や画像など)を統合的に理解し、そこから知識を自動的に獲得・蓄積し、活用していく仕組みが必要になるであろう。本講演では、自然言語の情報を活用しながら、状況や文脈の理解に深層学習を応用する研究の最新動向を紹介する。

テキスト・画像から音声への変換:滝口 哲也 氏(神戸大学)
概要:
本講演では、深層学習によるテキストから音声への変換(テキスト音声合成)の応用研究例として、発話障害者のコミュニケーション支援を目指した聞き取り困難な音声を聞き取り容易な音声に変換する音声合成を紹介します。また画像から音声への変換として、唇画像から音声への変換、及びハイスピード映像中の微小振動から音声への変換を紹介します。最後にこれらの技術の今後の展望について概説します。

モダリティ変換と画像生成:加藤 大晴 氏(東京大学)
概要:
深層学習によるエンコーダ・デコーダを用いたモダリティの変換は、機械翻訳(言語→他言語)で成功を収めたのち、画像の説明文の生成(画像→言語)や音声認識(音声→言語)などへと展開されてきました。この枠組みを用いて画像を生成する、つまり深層学習で画像デコーダを実現することはできるのでしょうか? 本講演では、このような観点から近年の画像生成手法の動向と私たちの取り組みを紹介します。
OS3: 3Dセンシングは進化しているか?
〜多様なセンサを用いた最先端技術と実応用〜
2018年6月15日(金)10:35-12:05

オーガナイザー:金崎 朝子 氏(産業技術総合研究所)
セッション概要:
本オーガナイズドセッションでは、3Dセンシング技術に関する基礎研究、および実応用に関して複数名のメンバを招き、現状把握、今後の展開等についてパネル討論を行う。RGBカメラ、デプスセンサ、RGB-Dカメラといった異なるデバイスを用いたアプローチを紹介し、様々な切り口から現状の3Dセンシング技術を俯瞰するとともに、 3Dセンシング技術の将来的方向性を議論する。
講演

RGB-D カメラによる建造物3次元復元と構造解析~不動産分野への応用~: 池畑 諭 氏(国立情報学研究所)
概要:
近年三次元計測技術の不動産応用が推進されています。例えばアメリカでは不動産会社が積極的に建物の三次元計測を行い、不動産内覧や間取り図のアーカイブ化に役立てようと試みられています。本講演では、不動産三次元計測の現状を概観し、我々の近年の取り組みとして、生の三次元センサ情報から建物の構造解析を行い、不動産応用に適した三次元モデルに変換する手法について紹介します。

RGB カメラによる深層学習を用いた3次元計測:関 晃仁 氏(東芝)
概要:
近年、深層学習が物体検出やセグメンテーション等で広く使われるようになってきました。画像ベースの3次元計測は古くから研究がされてきましたが、ここへきて深層学習を導入することで計測精度が飛躍的に向上してきました。本講演では、どのように深層学習を用いるのか、最新の研究内容を3次元計測処理のパイプラインに沿って紹介していきます。

高精度位置姿勢推定に基づくLiDARによる3次元計測~ドローンへの応用~:鈴木 太郎 氏(早稲田大学)
概要:
画像ベースの三次元計測と共に、LiDAR(Light Detection and Ranging)による三次元計測が近年急速に普及しつつあります。今後もソリッドステート型と呼ばれるLiDARの登場による小型化、低価格化が急速に進むと考えられ、自動運転やロボット、測量・計測分野においてLiDARは環境センシングのための鍵となるセンサになりそうです。この講演ではLiDARによる三次元計測の特徴、画像との比較について述べ、また実際のLiDARのロボットへの応用として、ドローン搭載LiDARによる三次元計測について紹介します。