日本語単語埋め込みモデルにおけるジェンダーバイアスの評価

酒井 新太朗; 鈴木 泰博

[3Xin4-45] 日本語単語埋め込みモデルにおけるジェンダーバイアスの評価

〇酒井新太朗¹、鈴木泰博¹ (1.名古屋大学)

キーワード：単語埋め込み、人工知能のバイアス、性別のバイアス

自然言語処理の分野における発展により，単語埋め込みモデルは単語の意味を低次元のベクトル空間で表現することを可能にした．単語埋め込みモデルは様々なタスクで応用されているが，性別や人種に関するバイアスを含むことが過去の研究で報告されている．単語埋め込みモデルにおけるバイアスを検証する研究は年々増えているが，日本語のモデルにおけるバイアスを検証した研究はほとんどない．本研究では，日本語Wikipediaの全記事によって学習されたモデルを用いて，日本語における単語埋め込みモデルの職業におけるジェンダーバイアスを検証した．その結果，看護師や歯科衛生士などの一部の職業が，強い女性バイアスをもっていることがわかった．また，これらの女性バイアスの強さは，それぞれの職業における女性の割合と強い相関関係があることがわかった(ρ = 0.78 with p < .001)．以上から，日本語の単語埋め込みモデルにおいても，職業におけるバイアスが存在し，それらのバイアスは職業内の性別の不均衡の度合いを反映していることがわかった．

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

講演情報

[3Xin4] ポスターセッション1

[3Xin4-45] 日本語単語埋め込みモデルにおけるジェンダーバイアスの評価

パスワード