2021年度 人工知能学会全国大会(第35回)

講演情報

一般セッション

一般セッション » GS-11 AIと社会

[4H3-GS-11d] AIと社会:テキスト解析

2021年6月11日(金) 13:40 〜 15:20 H会場 (GS 会場 3)

座長:乙武 北斗(福岡大学)

13:40 〜 14:00

[4H3-GS-11d-01] BERTモデルを用いたSDGsに関するマルチラベル文書分類器の構築とマッチングシステムの開発

〇鈴木 かの子1、松井 孝典1、川久保 俊2、増原 直樹3、岩見 麻子4、町村 尚1 (1. 大阪大学、2. 法政大学、3. 総合地球環境学研究所、4. 熊本県立大学)

キーワード:持続可能な開発目標、自然言語処理、マルチラベル文書分類、BERT

幅広いステークホルダーがSDGs(持続可能な開発目標)に取り組み,成功事例を共有することは重要である.そこで本研究は深層学習型の自然言語処理モデルBERTで,①活動事例や課題をSDGsに写像する分類器を構築すること,② SDGs間の連環関係 (nexus) を可視化すること,③地域課題とそれを解決しうる取り組み事例とのマッチングシステムを構築することを目的とした.まず,国連関連文書,日本の政府関連文書,内閣府が収集するSDGsの課題解決等に関する提案文書を収集し,各文書とそれに対応する複数のSDGsが対になったマルチラベルデータフレームを構築し,WordNetを用いたデータオーグメンテーションを行った.次に,訓練済み日本語BERTモデルをマルチラベルテキスト分類タスクでファインチューニングし,nested cross-validationでハイパーパラメータの最適化と交差検証精度の推定を行った.最後に,学習後のBERTモデルでSDGs間の共起ネットワークを可視化するとともに,地域課題と取り組み事例のベクトル埋め込みを行ってコサイン類似度を取得することで,マッチングシステムの開発を行った.

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード