[3-E-1-03] Fuzzy-C-Means法を用いたCOVID-19に関するセンチメント分析 ー日本語と対象としたTwitterユーザーに関する検証ー
COVID-19, Sentiment analysis, Twitter
2020年からCOVID-19による感染拡大に伴い諸外国ではロックダウンなどの政策が行われた。一方でSNSを用いた公衆衛生の情報収集を目的とした利用者が増加し、先行研究ではSNSデータを利用したセンチメント分析は効果的な公衆衛生の政策を行うための世論の把握に役立つと指摘している。そこで本研究では日本で施行された緊急事態宣言による国民の感情の変化についてセンチメント分析を行うことで明らかにし、世論の動向を把握することを目的とする。 本研究ではNTTデータ社「なずきのおと」により日本における1回目の緊急事態宣言の前後約2週間である2020年3月23日から4月21日を対象に「コロナ」、「COVID-19」、「新型肺炎」のキーワード含むTweetデータを対象とした4,894,009件を用いて日別ごとの処理を行った。センチメント分析にはTweetデータを単語ごとにベクトル化する処理を行い、感情辞書の単語にはクラスター分析の1つであるFuzzy-C-Means法を採用し、怒り、悲しみ、驚き、嫌悪、心配、信頼、喜びの7つの感情クラスターを設定した。次に感情クラスターの中心点と単語ベクトルで処理されたTweetがどの感情に一番近いかをベクトル距離の算出をした。分析の結果、対象とした期間内におけるTweet全体による感情の割合は心配(21.5%)、信頼(17.7%)、嫌悪(15.9%)、喜び(13.7%)、悲しみ(11.0%)、怒り(10.3%)、驚き(9.8%)となり、時系列による感情分析では緊急事態宣言発令日で嫌悪の感情値の割合が86.6%であった。本研究の結果から、日本における緊急事態宣言による公衆衛生の介入はSNS上において一般市民の感情の変化に影響する可能性が高いことが示唆され、公衆衛生の介入に対しての一般市民への影響、世論の反応をタイムリーに把握するための資料提供となると考える。