[2Win5-24] 簡易な文型記述法による職種・スキル定義文からの知識抽出前処理
キーワード:テキストマイニング、知識グラフ、知識獲得、大規模言語モデル
テキスト中の専門知識記述には分野特有の文体や表現が多く、統語解析の結果をそのまま、例えばテキスト中の述語-目的語関係を抽出することには問題がある。本研究は、簡便な文型記述法を提案し、テキストに記載された専門知識を知識グラフとして整理するための前処理の効率化を目指す。提案の記述法は、正規表現に類似したメタ文字列を活用し、統語的および意味的な制約を考慮した情報抽出が可能である。具体的な処理手法としては、まずテキスト中の文要素の依存関係を大まかに解析し、その上で文型記述に基づいて制約を適用する。また、意味的制約の適用には大規模言語モデルを活用した。
提案手法により、ジョブマッチングサービスにおける職種・スキル定義文データベースに含まれるテキストを対象に、文書群特有の構造や表現に対応した情報抽出を試みた。評価として、本手法と既存の係り受け構造解析により抽出した語や表現に基づくクラスタリングの結果を比較した。その結果、提案手法のクラスタリングにおいて凝集したクラスが形成され、テキスト特有の情報の特徴を捉えたグループ化が可能であると確認された。以上により提案手法を利用した情報抽出の有効性を確認した。
提案手法により、ジョブマッチングサービスにおける職種・スキル定義文データベースに含まれるテキストを対象に、文書群特有の構造や表現に対応した情報抽出を試みた。評価として、本手法と既存の係り受け構造解析により抽出した語や表現に基づくクラスタリングの結果を比較した。その結果、提案手法のクラスタリングにおいて凝集したクラスが形成され、テキスト特有の情報の特徴を捉えたグループ化が可能であると確認された。以上により提案手法を利用した情報抽出の有効性を確認した。
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。