2020年度 人工知能学会全国大会(第34回)

講演情報

一般セッション

一般セッション » J-9 自然言語処理・情報検索

[4Q3-GS-9] 自然言語処理・情報検索: 社会問題応用

2020年6月12日(金) 14:00 〜 15:20 Q会場 (jsai2020online-17)

座長:吉田光男(豊橋技科大)

14:40 〜 15:00

[4Q3-GS-9-03] 深層学習を利用した特許請求項ベースの特許技術俯瞰マップ

〇坪田 匡史1、宮村 祐一1、神津 友武1 (1. 有限責任監査法人トーマツ)

キーワード:LSTM、Sentence embedding、特許マップ、請求項

特許情報は企業の事業戦略の策定や提携先の模索等に有用であり、膨大な特許情報に基づいて技術動向把握を行なううえで、特許技術の俯瞰マップは不可欠なツールである。俯瞰マップ上では、各発明がベクトルとして、発明間の類似度がベクトル間の距離として、それぞれ表現される。従来、発明のベクトル表現化には、単語の出現頻度をベースとするTF-IDF法が広く用いられてきた。しかし、TF-IDF法は、単語間類似度を考慮することが難しく、比較的少数(1000件程度)の特許文献からなる分析対象母集団について、特許請求項を用いてマップ上でクラスタが形成されにくいという課題があった。

本研究では、特許請求項に基づく新規の類似発明判別タスクによってLSTMモデルを訓練し、訓練済みモデルから得られる発明のベクトル表現を俯瞰マップ作成に用いる。請求項中の単語は、類義語等の情報を考慮するため、明細書データなどから獲得した単語分散表現に変換したうえでモデルへのインプットとする。本稿では、上記手法により、1000件未満の比較的少数の特許文献からなる母集団について作成した俯瞰マップにおいても、技術クラスタが明確となることを確認する。

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード