[4Xex-45] 株式会社Turingの取り組み:日本語テキストデータセットと視覚言語モデルの開発紹介
[[ブース E-31]]
uringでは、自動運転のための日本語に特化した大規模・高品質な画像テキストインタリーブデータセット「MOMIJI」を構築しました。本展示では、MOMIJIを活用して学習されたマルチモーダル言語モデル「Heron-NVILA-Lite」や、そのiOS端末向け軽量実装、ベンチマーク結果などをご紹介します。日本語視覚言語モデルの性能向上と応用可能性について、皆様と議論させていただければと思います。研究・採用・インターンに関するご相談も歓迎しておりますので、ぜひお気軽にお立ち寄りください。
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。