09:20 〜 09:40
[2K1-02] 句構造解析とクラスタリングを用いた会話履歴の要約
キーワード:会話、要約、テキストクラスタリング
コンタクトセンタには,日々大量に蓄積される会話履歴を活用し,オペレータの応対品質を上げるという課題がある.そのためには,多数の会話履歴を会話の流れが把握できる形で,一覧できるよう要約することが求められている.本稿では,大量の同一トピックに関する会話履歴を木構造のグラフに要約する手法を提案する.
手法は2段階から成り,1)各会話を構造解析の後,2)会話集合をクラスタリング,を行う.各会話の構造解析においては,文脈自由文法を用いて会話の構造を解析し,ラベルを付与する.その後に,同一層のノード群に対し,ラベル及び出現単語に基づきクラスタリングを行う.
提案手法により,会話の流れを保持した形で大量の会話履歴を要約することが出来る.また,本稿では,この手法により起こる会話要約上の課題を提示し,多重整列(Multi-Sequence Alignment)により問題を軽減する.
提案手法により,実データを2時間程度のルール作成の手間により,充分小さいサイズの木に要約することができた.また,多重整列により,全体ノード数の削減とクラスタリング結果の評価指標である純度の向上が見られた.
手法は2段階から成り,1)各会話を構造解析の後,2)会話集合をクラスタリング,を行う.各会話の構造解析においては,文脈自由文法を用いて会話の構造を解析し,ラベルを付与する.その後に,同一層のノード群に対し,ラベル及び出現単語に基づきクラスタリングを行う.
提案手法により,会話の流れを保持した形で大量の会話履歴を要約することが出来る.また,本稿では,この手法により起こる会話要約上の課題を提示し,多重整列(Multi-Sequence Alignment)により問題を軽減する.
提案手法により,実データを2時間程度のルール作成の手間により,充分小さいサイズの木に要約することができた.また,多重整列により,全体ノード数の削減とクラスタリング結果の評価指標である純度の向上が見られた.