2025年度 人工知能学会全国大会(第39回)

講演情報

オーガナイズドセッション

オーガナイズドセッション » OS-42 大規模言語モデルの安全対策 ― 大いなる力には、大いなる責任が伴う

[3F4-OS-42a] 大規模言語モデルの安全対策 ― 大いなる力には、大いなる責任が伴う

2025年5月29日(木) 13:40 〜 15:20 F会場 (会議室1001)

オーガナイザ:金子 正弘(MBZUAI),小島 武(東京大学),磯沼 大(The University of Edinburgh/東京大学),丹羽 彩奈(MBZUAI),大葉 大輔(ELYZA/東京科学大学),村上 明子(AIセーフティーインスティチュート),関根 聡(情報学研究所),内山 将夫(情報通信研究機構),Danushka Bollegala(The University of Liverpool/Amazon)

14:40 〜 15:00

[3F4-OS-42a-04] 安全な多言語・多文化対応の大規模言語モデルの構築

国際レッドチーミングチャレンジからの示唆と課題

〇江間 有沙1 (1. 東京大学)

キーワード:大規模言語モデル、安全性、多文化・多言語

生成人工知能(AI)の利用が世界的に広まるにつれ、AIモデルが地域ごとの文化や言語におけるリスクや懸念を敏感に反映できることがますます重要になっている。何がリスクや有害なコンテンツなのかを地域・文化ごとに特定する作業を更新し続けていくことが必要となり、そのためには多様な分野や専門性を持つ人との協業が重要となる。
本発表では2024年11月から開催されたシンガポール政府のイニシアティブの「AI安全性レッドチームチャレンジ」の参加した知見から得られた、国際的な議論や学際的な協力体制における課題について考察する。

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード