JSAI2025

Presentation information

Poster Session

Poster session » Poster Session

[2Win5] Poster session 2

Wed. May 28, 2025 3:30 PM - 5:30 PM Room W (Event hall D-E)

[2Win5-24] Preprocessing for Extracting Knowledge from Job and Skill Definition Sentences with a Simplified Sentence Pattern Description

〇Masahito Yasui1, Tetsuro Kitajima2, Hiroki Tanida2, Kosuke Miyoshi2, Shigeyuki Oba2, Kazuhiro Takeuchi1, Kouji Kozaki1 (1.Osaka Electro-Communication University, 2.MIIDAS CO., LTD. HR Science Institute.)

Keywords:Text Mining, Knowledge Graph, Knowledge Acquisition, Large Language Model

テキスト中の専門知識記述には分野特有の文体や表現が多く、統語解析の結果をそのまま、例えばテキスト中の述語-目的語関係を抽出することには問題がある。本研究は、簡便な文型記述法を提案し、テキストに記載された専門知識を知識グラフとして整理するための前処理の効率化を目指す。提案の記述法は、正規表現に類似したメタ文字列を活用し、統語的および意味的な制約を考慮した情報抽出が可能である。具体的な処理手法としては、まずテキスト中の文要素の依存関係を大まかに解析し、その上で文型記述に基づいて制約を適用する。また、意味的制約の適用には大規模言語モデルを活用した。
提案手法により、ジョブマッチングサービスにおける職種・スキル定義文データベースに含まれるテキストを対象に、文書群特有の構造や表現に対応した情報抽出を試みた。評価として、本手法と既存の係り受け構造解析により抽出した語や表現に基づくクラスタリングの結果を比較した。その結果、提案手法のクラスタリングにおいて凝集したクラスが形成され、テキスト特有の情報の特徴を捉えたグループ化が可能であると確認された。以上により提案手法を利用した情報抽出の有効性を確認した。

Authentication for paper PDF access
A password is required to view paper PDFs. If you are a registered participant, please log on the site from Participant Log In.
You could view the PDF with entering the PDF viewing password bellow.

Password