2:00 PM - 2:20 PM
[1Q3-OS-35-02] Improving Information Extraction from Property Information PDFs Using LLM
Keywords:Information Extraction, Data Structuring, LLM
本研究では、不動産業界で物件情報の流通に使用されるPDFデータからの情報抽出の精度向上を目指す。先行研究では、OCRを用いてテキスト情報を抽出した後、大規模言語モデル(LLM)を用いる2ステップの手法により、高精度に物件情報を抽出可能なことが示されている。本研究では、PDFを直接入力可能な商用マルチモーダルLLMを用いた情報抽出を検証する。実験では、OCRを用いる手法、PDFを画像に変換してLLMに入力する手法、PDFを直接商用LLMに入力する手法の精度を比較し、その出力結果を分析する。
Authentication for paper PDF access
A password is required to view paper PDFs. If you are a registered participant, please log on the site from Participant Log In.
You could view the PDF with entering the PDF viewing password bellow.