15:00 〜 18:00
〇岡崎 直観1 (1. 東京工業大)
チュートリアルセッション
2023年9月3日(日) 15:00 〜 18:00 稲盛ホール (芝蘭会館)
座長:下平 英寿(京都大)
講師:岡崎 直観(東京工業大)
概 要:ChatGPTやGPT-4の登場で「言語モデル」が一躍脚光を浴びているが、その歴史は古くコンピュータの黎明期まで遡る。本講演では、n-gram言語モデルから出発し、単語埋め込み、系列変換モデル、注意機構、トランスフォーマーなどの深層学習ベースの言語モデルの要素技術を概観する。その後、事前学習とファインチューニングによる言語モデルの応用、プロンプトと指示チューニングによる言語モデルの汎用化、思考の連鎖による性能向上、人間のフィードバックに基づく強化学習など、最近の大規模言語モデルが取り入れているアイディアを説明する。最後に、大規模言語モデルが社会にもたらす悪影響に触れ、その解決に向けた取り組みを紹介する。
15:00 〜 18:00
〇岡崎 直観1 (1. 東京工業大)
要旨・抄録、PDFの閲覧には参加者用アカウントでのログインが必要です。参加者ログイン後に閲覧・ダウンロードできます。
» 参加者用ログイン