2024年度 人工知能学会全国大会(第38回)

講演情報

チュートリアル

チュートリアル » チュートリアル

[3B5-TS-1] 大規模言語モデルの開発(岡崎 直観)

2024年5月30日(木) 15:30 〜 17:10 B会場 (中ホール)

座長:清田 陽司(麗澤大学)

15:30 〜 17:10

[3B5-TS-1-01] 大規模言語モデルの開発

岡崎 直観1 (1. 東京工業大学)

本講演では、大規模言語モデルの開発に必要な基礎および最新動向を概観する。その後、東京工業大学情報理工学院の岡崎研究室と横田研究室、産業技術総合研究所の研究チームで開発された大規模言語モデルSwallowの開発経験を踏まえ、学習データの構築、モデルの学習や評価などを説明し、日本語に強い大規模言語モデルの現状や課題を議論したい。

要旨・抄録、PDFの閲覧には参加者用アカウントでのログインが必要です。参加者ログイン後に閲覧・ダウンロードできます。
» 参加者用ログイン