14:40 〜 15:00
[1D3-GS-13-05] SDGs日本語データセット及び分類タスクベースラインの作成
キーワード:持続可能な開発目標、自然言語処理、深層学習、人工知能、クラス分類
SDGs(持続可能な開発目標)は社会システムや産業構造を変えている現在、アカデミーによる取組が求められるようになってきた。しかし、日本語リソースが少ないため日本での取組が困難であった。本研究では、日本語のSDGs関連データを大学が公表している資料から集め、データセットを作成した。そして、SDGs分類モデルを構築した。オーギュメンテーション手法として、1. BERT MASKモデルを用いて品詞置き換え 2. Google transferを用いて英訳したものを再度日本語訳した逆翻訳手法 を用いた。古典機械学習手法であるトピックモデル(LDA等)及び深層学習モデルであるBERT等を用いて分類を行った。結果は少数データタスクにおいてオーグメンテーションの成果を示す。また、データ数が少ない中で比較的に高い精度を出すことを目指す。
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。