13:40 〜 14:00
[3F4-OS-42a-01] 中国系大規模言語モデルにおける検閲的ファインチューニング
キーワード:大規模言語モデル、中国、検閲、ファインチューニング
中国で開発される大規模言語モデル(LLM)には「社会主義核心価値観を堅持する」ことが求められている。先行研究は敏感質問を構築し、その問題を検討してきた。本研究では検閲の内容を更に詳細に明らかにすることを目的として、まず2024年2月に公表された生成式人工智能服務安全基本要求を紹介する。次に中国電子技術標準化研究院と復旦大学が作成したベンチマーク問題集を利用してLLMを評価した。分析対象としたのは主要な中国系オープンソースLLM、それをもとに日本向けにファインチューニングされた派生系モデル、そして欧米系LLMである。分析の結果、中国系モデルおよび派生系モデルにおいて検閲の形跡が示された。これらのLLMを利用するうえで、中国系モデルに施されているファインチューニングを認識し、用途に応じて十分な確認を行っていくべきことが示唆される。
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。