[1Win4-45] proposal for a method to create sentiment-annotated data by two-sentence comparisons of sentences on factors affecting performance
Keywords:sentiment analysis, sentences on factors affecting performance, information extraction
近年のニューラル言語モデルの成功により, 自然言語処理分野は大きな発展を遂げている.金融分野においても業績報告資料やニュースなどを対象にテキスト分析が行われている.特にセンチメント分析は定性データであるテキストデータを定量データであるセンチメントに変換することが可能であり,金融テキスト分析において重要な役割を担っている.近年のセンチメント変換にはニューラル言語モデルを用いるのが主流であるが,多くのモデルはポジティブ,ネガティブのような離散ラベルを用いて開発されている.しかし,文のセンチメントには強弱が存在し,本来は連続値である.本研究では, テキストの極性比較を行うことにより文ごとのレーティングを計算することで,連続値を付与したデータの作成方法を提案する.次に,決算短信に記載されている業績要因に関する文を対象に提案手法を適用しデータを作成した.そして作成したデータを用いてセンチメントモデルを開発し,その有効性を確認した.
Authentication for paper PDF access
A password is required to view paper PDFs. If you are a registered participant, please log on the site from Participant Log In.
You could view the PDF with entering the PDF viewing password bellow.