[3Yin2-02] BERTベース分類器とSHAPによる地方議会会議録における特徴表現抽出の試み
キーワード:地方議会会議録、シャープレイ値、特徴表現、BERT
地方議会会議録の発言文に含まれるキーワードなどの特徴的な表現は、その地域の課題や発言者の主張を把握する上で有用であることに加え、方言などを見つける手がかりにもなる。発言文から地域や発言者を推定する分類器において、分類に寄与するトークンは地域や発言者を特徴付ける表現になる可能性がある。本研究では全国の地方議会会議録を対象にBERTベースの分類器を構築し、SHapley Additive exPlanations(SHAP)に基づいて分類に寄与するトークンを特徴表現として抽出した。実験の結果、分類の精度は約50%となったが、分類に成功した発言文からは地域特有の表現として、地名、方言、政治課題などが抽出された。また、同じトークンであっても発言文の文脈によって分類への寄与率が異なり、文脈を考慮した複数トークンから成る特徴表現の抽出が可能であることを確認した。
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。