13:40 〜 14:00
[4H3-GS-11d-01] BERTモデルを用いたSDGsに関するマルチラベル文書分類器の構築とマッチングシステムの開発
キーワード:持続可能な開発目標、自然言語処理、マルチラベル文書分類、BERT
幅広いステークホルダーがSDGs(持続可能な開発目標)に取り組み,成功事例を共有することは重要である.そこで本研究は深層学習型の自然言語処理モデルBERTで,①活動事例や課題をSDGsに写像する分類器を構築すること,② SDGs間の連環関係 (nexus) を可視化すること,③地域課題とそれを解決しうる取り組み事例とのマッチングシステムを構築することを目的とした.まず,国連関連文書,日本の政府関連文書,内閣府が収集するSDGsの課題解決等に関する提案文書を収集し,各文書とそれに対応する複数のSDGsが対になったマルチラベルデータフレームを構築し,WordNetを用いたデータオーグメンテーションを行った.次に,訓練済み日本語BERTモデルをマルチラベルテキスト分類タスクでファインチューニングし,nested cross-validationでハイパーパラメータの最適化と交差検証精度の推定を行った.最後に,学習後のBERTモデルでSDGs間の共起ネットワークを可視化するとともに,地域課題と取り組み事例のベクトル埋め込みを行ってコサイン類似度を取得することで,マッチングシステムの開発を行った.
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。