09:00 〜 09:20
[2H1-OS-3a-01] 政治資金収支報告書のOCRによる政治資金データベースへの試み
キーワード:OCR、政治資金収支報告書
政治資金収支報告書は、政治団体によって提出され、政治資金規正法により公表が義務付けられています。しかし、これらの報告書は多くが手書き文字を含む紙媒体であり、機械判読に適さず、オープンデータの定義を満たしません。そのため、これらのデータをデータベース化することで透明性が向上し、市民による政治的な意思決定への参加が促進されると考えられます。本研究では、政治資金収支報告書の「(その2)収支の状況」に限定し、光学式文字認識(OCR)技術を用いてデータの抽出と整備を行いました。具体的には、2019年に提出された政治資金収支報告書に対し、収支の状況ページからデータを抽出し、データセットを構築しました。また、作成したデータセットを元に分析例を示しました。本研究は、政治資金データベースの作成に向けた第一歩であり、今後も政治資金報告書の形式やデータの改善に取り組むことが求められます。政治資金データベースの構築は、より透明で民主的な社会を実現するための重要な一歩であると考えられます。
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。