09:40 〜 10:00
[2E1-GS-13-03] RPAを用いた医療特許の半自動分類システムの研究
キーワード:RPA、医療機器特許、自然言語処理
医療機器関連の特許や審査書類は大量にあるが、大半が紙媒体の申請でデジタル化されていない。これらを自動的にデジタル化し、解析することで新たな知見を得られる可能性がある。そのため、医療機器関連の特許や審査書類をデジタル化し、半自動分類をするシステムを構築した。
Adobe Acrobat DCを用いて特許書類をデジタル化し、形態素に分解する。形態素の重要度をTF-IDF法を用いて計算し、誤変換の頻度の高いワードを抽出する。その後、RNNを用いてテキストデータを大分類4種、小分類127種に分類する。これらを自動的に行うRPAシステムをPythonベースで構築した。その結果、高い分類精度を得ることができた。
Adobe Acrobat DCを用いて特許書類をデジタル化し、形態素に分解する。形態素の重要度をTF-IDF法を用いて計算し、誤変換の頻度の高いワードを抽出する。その後、RNNを用いてテキストデータを大分類4種、小分類127種に分類する。これらを自動的に行うRPAシステムをPythonベースで構築した。その結果、高い分類精度を得ることができた。
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。