16:40 〜 17:20
[3F5-OS-42b-04] (OS招待講演)安全な大規模言語モデルの構築と利用を目指して
キーワード:大規模言語モデル、安全性、バイアス
本講演では、合成データに基づく指示チューニングによる安全性の強化など、大規模言語モデル(LLM)の構築における安全性への取り組みに加えて、LLMの(言語横断的な)バイアス測定、自己改善によるバイアス除去、メンバーシップ推論攻撃とその回避策、LLM検出(LLMによって生成されたテキストかを識別すること)の頑健性向上など、LLMの利用における安全性に関する研究を紹介します。
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。