14:20 〜 16:00
[1D4-TS-3-01] 自然言語処理とVision-and-Language
BERTやGPT-3に代表される,巨大なニューラルネットワークを大量のテキストで自己教師あり学習した汎用言語モデルの登場により,一部の自然言語理解のベンチマークタスクでは人工知能が人間のスコアを凌駕するまでに成長した.こうした大量のデータで事前に学習するアプローチは,Vision-and-Languageと呼ばれる画像情報と言語情報を組合せた課題解決を行う研究分野にも導入され,画像に対する質問応答などのタスクで大きな成果を挙げている.本チュートリアルでは,自然言語処理およびVision-and-Language分野について汎用モデルを中心に最新の動向を紹介する.さらに応用タスクとして,我々が取り組んでいる文書画像の読解について現在の到達点および今後の展望について触れる.
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。