[OS1-02] 動画からの意図理解のこれまでとこれから
深層学習の成功により、動画像から意味を推定する手法は大きな発展を遂げました。特に画像に関する質問に答えたり、自動で映像編集をしたりといった、あたかもシステムが見た内容を理解しているかのような振る舞いは、人工知能ブームを盛り上げた一因でしょう。しかし、そのようなシステムは実際のところ「何を見て」、「何を理解」しているのでしょうか。今回は画像・映像理解研究のこれまでの取り組みと、複雑化するタスクから実際に何ができるようになったのかを事例をふまえて概説します。最後にこれまでの意味理解を超えて、動画からの意図理解を目指す試みについて議論します。
抄録パスワード認証
受付時にパスワードを配布いたします。