[3Xin2-36] 大規模言語モデルの金融投資意思決定バイアスに関する評価指標の構築
キーワード:大規模言語モデル、大規模言語モデルのバイアス測定、金融教育
近年,新たな認可法人の設置や新NISA制度の導入を背景に,様々な年齢層を対象とした金融教育への関心が高まっている.これに伴い,チャットボットやロボアドバイザーなどの金融教育を支援するサービスの増加が予想される.これらのサービスにおける大規模言語モデル(LLM)の利用の増加が見込まれる.しかし,LLMはしばしばブラックボックスとされ,出力結果に人種差別などのバイアスが含まれていることが問題となる.
そこで,本研究では,金融教育の文脈における大規模言語モデルのバイアスを測定・評価する指標の開発を目指す.行動経済学の考え方を参考に,リスク選好,時間選好,社会的選好に関するLLMの評価方法を開発する.また,提案した評価指標を用いてGPT 3.5d や PaLM などのLLMを評価し,その結果を紹介する.
そこで,本研究では,金融教育の文脈における大規模言語モデルのバイアスを測定・評価する指標の開発を目指す.行動経済学の考え方を参考に,リスク選好,時間選好,社会的選好に関するLLMの評価方法を開発する.また,提案した評価指標を用いてGPT 3.5d や PaLM などのLLMを評価し,その結果を紹介する.
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。