10:00 〜 10:20
[3G1-GS-11-04] AI安全性のための日本語徳倫理データセットの作成
キーワード:自然言語処理、AI安全性、徳倫理学、AIアライメント
大規模言語モデルなどの一部のAIモデルは人間にとって有害な生成をすることで知られている。また将来のAIモデルが、我々の倫理を理解し、適切に振る舞うためのAIアライメント研究がなされている。しかしこれらの研究の多くは英語で行われており、日本語での研究は少ない。そこで本研究ではAIの安全性に対処するためのデータセットとして、規範倫理学の主要な立場である徳倫理を参照したデータセットを作成する。既存の英語の徳倫理データセットの作成方法と同様の構築方法によって新しく日本語のデータセットを作成する。作成されたデータセットは約2万件からなり、ある行為を表す文とその行為に対応する性格特性用語を正しく分類することが求められる。既存の日本語大規模言語モデルで実験したところ、正しく分類するのが困難であることがわかった。また既存の英語の徳倫理データセットとの比較も行った。
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。