[4Rin1-56] 特許構造を考慮したグラフベース教師なし重要技術語抽出
キーワード:自然言語処理、特許解析、キーワード抽出、グラフベースモデル
発明の技術的特徴を表している重要技術語を抽出することは特許分析において有用であるが,従来のアプローチは特許文書全体の構造情報を考慮していないため,意味的に雑多なキーワードが抽出されてしまう問題があった.
本研究では,特許文書全体の構造情報とその意味関係をグラフで表現したグラフベースの教師なし重要技術語抽出手法を提案する.
提案手法の重要技術語の抽出性能を,複数のキーワード抽出手法(TF-IDF,TextRank,PositionRank)との間で比較した.
提案手法はF値が65.15 %と最も高く ,特許技術分野によらず一貫して最も高い抽出性能を示した.
本研究では,特許文書全体の構造情報とその意味関係をグラフで表現したグラフベースの教師なし重要技術語抽出手法を提案する.
提案手法の重要技術語の抽出性能を,複数のキーワード抽出手法(TF-IDF,TextRank,PositionRank)との間で比較した.
提案手法はF値が65.15 %と最も高く ,特許技術分野によらず一貫して最も高い抽出性能を示した.
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。