15:40 〜 16:00
[1L4-OS-4a-03] 可視化を用いた単語埋め込みのジェンダーバイアスとデバイアスの影響分析
キーワード:単語埋め込み、ジェンダーバイアス、可視化
近年チャットボットや画像解析技術を用いた翻訳など,AIを活用したサービスが日々増加し,AIは我々の生活のあらゆる場面で活躍している.単語埋め込みとは,自然言語処理において単語を数値に変換してコンピュータ上で扱えるようにする技法である.しかし,単語埋め込みには,言語モデルを作成する際の事前学習に用いたデータセットに内包されたバイアスが,そのモデルに影響を与える欠点がある.日本語の単語埋め込みのバイアス及びデバイアスは先行研究が少なく,そのほとんどの研究対象が英語の単語埋め込みである.そこで本研究は,日本語版Wikipediaを元に学習した学習済みWord2vecのデータセットからジェンダーバイアスを検出し,それらをデバイアスした結果を可視化し,バイアスの分類に取り組んだ.デバイアス処理がもたらすモデルへの影響を目で確認しながらデバイアス処理のパラメータを操作すべきという観点から,本研究では可視化を導入する.分類に着手した理由は,モデルの性能劣化を抑えたバイアス緩和を実現するためである.実験の結果,バイアスが多いカテゴリと,デバイアスの影響を受けやすいカテゴリに差違があることが確認された.
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。