（OS招待講演）安全な大規模言語モデルの構築と利用を目指して

岡崎 直観

講演情報

オーガナイズドセッション

オーガナイズドセッション » OS-42 大規模言語モデルの安全対策 ― 大いなる力には、大いなる責任が伴う

[3F5-OS-42b] 大規模言語モデルの安全対策 ― 大いなる力には、大いなる責任が伴う

2025年5月29日(木) 15:40 〜 17:20 F会場 (会議室1001)

オーガナイザ：金子正弘（MBZUAI），小島武（東京大学），磯沼大（The University of Edinburgh／東京大学），丹羽彩奈（MBZUAI），大葉大輔（ELYZA／東京科学大学），村上明子（AIセーフティーインスティチュート），関根聡（情報学研究所），内山将夫（情報通信研究機構），Danushka Bollegala（The University of Liverpool／Amazon）

16:40 〜 17:20

[3F5-OS-42b-04] （OS招待講演）安全な大規模言語モデルの構築と利用を目指して

〇岡崎直観¹、金子正弘² (1. 東京科学大学、2. MBZUAI)

キーワード：大規模言語モデル、安全性、バイアス

本講演では、合成データに基づく指示チューニングによる安全性の強化など、大規模言語モデル（LLM）の構築における安全性への取り組みに加えて、LLMの（言語横断的な）バイアス測定、自己改善によるバイアス除去、メンバーシップ推論攻撃とその回避策、LLM検出（LLMによって生成されたテキストかを識別すること）の頑健性向上など、LLMの利用における安全性に関する研究を紹介します。

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。