12:40 〜 13:00
[4E2-OS-7a-02] 法律の要約のためのランダムフォレストを用いた重要文抽出
キーワード:法令のあらまし、自動要約、ランダムフォレスト
本研究の目標は,日本法令の要約を提供することである.そのためにランダムフォレストによる重要文抽出に基づく自動要約を提案する.
従来の自動要約に関する研究においては,原文書の情報のみが用いられてきた.近年では機械学習に基づく手法なども提案されている.
しかし,そうした機械学習において利用される学習データの量は,特に日本語においては,充分でなかった.
それに対し,本研究の法令の要約においては,政府が作成する「法令のあらまし」を利用することにより,この問題を解決する.
さらに,従来利用されてきた決定木やSVMを使った手法に代えて,ランダムフォレストを用いた重要文抽出を提案し,その性能が従来手法を上回ることを示す.
本論文の貢献は,従来よりもサイズの大きな要約用コーパスを作成した点と,重要文抽出におけるランダムフォレストの有効性を確認した点にある.
従来の自動要約に関する研究においては,原文書の情報のみが用いられてきた.近年では機械学習に基づく手法なども提案されている.
しかし,そうした機械学習において利用される学習データの量は,特に日本語においては,充分でなかった.
それに対し,本研究の法令の要約においては,政府が作成する「法令のあらまし」を利用することにより,この問題を解決する.
さらに,従来利用されてきた決定木やSVMを使った手法に代えて,ランダムフォレストを用いた重要文抽出を提案し,その性能が従来手法を上回ることを示す.
本論文の貢献は,従来よりもサイズの大きな要約用コーパスを作成した点と,重要文抽出におけるランダムフォレストの有効性を確認した点にある.