JSAI2025

Presentation information

Organized Session

Organized Session » OS-35

[1Q3-OS-35] OS-35

Tue. May 27, 2025 1:40 PM - 3:20 PM Room Q (Room 804)

オーガナイザ:中田 百科(リクルート),村田 達郎(リクルート),山下 雄大(Megagon Labs)

2:00 PM - 2:20 PM

[1Q3-OS-35-02] Improving Information Extraction from Property Information PDFs Using LLM

〇Gakuto Higuchi1, Shin Kanouchi2,3, Yutaro Saito3, Kentaro Matsumoto3, Tatsuya Iwanari3 (1. Kagawa University, 2. NLPeanuts Inc., 3. estie, inc.)

Keywords:Information Extraction, Data Structuring, LLM

本研究では、不動産業界で物件情報の流通に使用されるPDFデータからの情報抽出の精度向上を目指す。先行研究では、OCRを用いてテキスト情報を抽出した後、大規模言語モデル(LLM)を用いる2ステップの手法により、高精度に物件情報を抽出可能なことが示されている。本研究では、PDFを直接入力可能な商用マルチモーダルLLMを用いた情報抽出を検証する。実験では、OCRを用いる手法、PDFを画像に変換してLLMに入力する手法、PDFを直接商用LLMに入力する手法の精度を比較し、その出力結果を分析する。

Authentication for paper PDF access
A password is required to view paper PDFs. If you are a registered participant, please log on the site from Participant Log In.
You could view the PDF with entering the PDF viewing password bellow.

Password