2024年度 人工知能学会全国大会(第38回)

講演情報

一般セッション

一般セッション » GS-2 機械学習

[2B1-GS-2] 機械学習:テキストマイニング

2024年5月29日(水) 09:00 〜 10:40 B会場 (中ホール)

座長:坂地 泰紀(北海道大学)

09:20 〜 09:40

[2B1-GS-2-02] 異なる粒度が混在する教師データに適応した階層型マルチラベル分類モデル

〇宮島 健悟1、布目 悠人1、阪井 優太1、後藤 正幸1 (1. 早稲田大学)

キーワード:階層型マルチラベル分類、埋め込み表現、ボックス埋め込み、BERT、文書分類

文書データにおけるマルチラベル分類は,各文書データに対して複数のクラスラベルを正しく付与するタスクである.ただし,文書データに付与される複数のラベル間には,意味的な階層構造が存在することが多く,このような階層構造を考慮することでラベルの予測精度が向上することがある.このようなラベル間の意味的な階層構造を考慮したマルチラベル分類モデルの1つとして,Multi-label Box Model(以下,MBM)が提案されており,教師データに全ての階層のクラスラベルが付与されている場合において有効性が示されている.しかし,実世界のユーザ投稿型サイトに投稿されているような文書データには,全ての階層のクラスラベルが付与されていない場合も多く,このようなデータをそのまま用いてMBMの学習を行うと,ラベルの予測精度が低下してしまう.そこで本研究では,BERTを導入することにより,不足している階層のラベルを補完してMBMを学習するフレームワークを提案する.また,一部の階層のラベルが不足しているデータに対して従来手法および提案手法を適用した場合の精度を比較した評価実験を通じ,提案手法の有効性を示す.

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード