2020年度 人工知能学会全国大会(第34回)

講演情報

一般セッション

一般セッション » J-13 AI応用

[1D3-GS-13] AI応用: テキストマイニングと自然言語

2020年6月9日(火) 13:20 〜 15:00 D会場 (jsai2020online-4)

座長:梅原英一(東京都市大)

14:40 〜 15:00

[1D3-GS-13-05] SDGs日本語データセット及び分類タスクベースラインの作成

〇張 鑫1、本木 悠介2、曽根岡 侑也1、岩澤 有祐1、松尾 豊1 (1. 東京大学大学院、2. 慶應大学大学院)

キーワード:持続可能な開発目標、自然言語処理、深層学習、人工知能、クラス分類

SDGs(持続可能な開発目標)は社会システムや産業構造を変えている現在、アカデミーによる取組が求められるようになってきた。しかし、日本語リソースが少ないため日本での取組が困難であった。本研究では、日本語のSDGs関連データを大学が公表している資料から集め、データセットを作成した。そして、SDGs分類モデルを構築した。オーギュメンテーション手法として、1. BERT MASKモデルを用いて品詞置き換え 2. Google transferを用いて英訳したものを再度日本語訳した逆翻訳手法 を用いた。古典機械学習手法であるトピックモデル(LDA等)及び深層学習モデルであるBERT等を用いて分類を行った。結果は少数データタスクにおいてオーグメンテーションの成果を示す。また、データ数が少ない中で比較的に高い精度を出すことを目指す。

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード