09:40 〜 10:00
[4S1-GS-2-03] 顧客意見分析のためのラベル間距離尺度に基づく構造化手法の提案
キーワード:テキストクラスタリング、顧客の声、トピックモデル、潜在ディリクレ配分、ワッサースタイン距離
様々なチャネルを通じた企業への顧客からの声は企業にとって貴重なフィードバックであり,製品やサービスの改善,顧客満足度の向上に繋がる重要な情報源である.例えば企業Aでは顧客からの申出に対して,予め定めた階層構造のラベルを付与し分析を行っている.同様の申出内容に対して同一のラベルが付与されていれば,ラベルごとの苦情件数を活用した苦情トレンドの把握は有効な分析となる.しかし現状は膨大な申出件数に対して都度追加されるラベルが存在するなどして複雑化しており,現状のラベル体系を活用した分析では検知できていない申出や苦情があるといった懸念がある.
そこで本研究では,申出内容の文書を用いて既存ラベル間の関係性を定量的に評価する.具体的にはLDAで得られた文書の特徴量に対し,申出文書を別のラベルに再分類する輸送コストを定量化する.その際,再分類コストの定量化に分布間の距離を比較する手法であるワッサースタイン距離を導入し,より顧客の申出内容の実データに即したラベル構造を構築する手法を提案する.本手法を実データに適用し,提案手法を用いて文書内容に合致したラベルの構造化が可能であることを示す.
そこで本研究では,申出内容の文書を用いて既存ラベル間の関係性を定量的に評価する.具体的にはLDAで得られた文書の特徴量に対し,申出文書を別のラベルに再分類する輸送コストを定量化する.その際,再分類コストの定量化に分布間の距離を比較する手法であるワッサースタイン距離を導入し,より顧客の申出内容の実データに即したラベル構造を構築する手法を提案する.本手法を実データに適用し,提案手法を用いて文書内容に合致したラベルの構造化が可能であることを示す.
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。