[2-G-1-OP5-5] 症状に関するつぶやき数の多重線形回帰による感染性胃腸炎流行規模の推定
【背景・目的】感染症は例年,百万人を超える患者の規模で流行しており,流行の抑制が重要な課題となっている.流行の抑制を実現するためには,感染症の流行規模や患者数推移の早期把握などが課題に挙げられ,対策として感染症サーベイランスと呼ばれる感染者数の集計が実施されている.しかし,感染症サーベイランスは連携医療施設からの報告に依存しているため,集計に時間が必要である.そこで近年,SNS (Social networking service)を用いた感染症サーベイランスが注目されている.SNSを通して,インフルエンザなど大規模かつ季節的な感染症の流行を早期把握する試みは一定の成果が報告されている.一方で,小規模かつ突発的な活動に対しては十分な調査がされておらず,検討の余地がある.そこで本研究では,日本において二番目に報告数が多く,突発的に流行する感染性胃腸炎を対象として,当該疾患の流行をSNSによりどの程度の推定が可能かの検討を行う.
【手法】日本国内でSNSにおける感染性胃腸炎の症状に関するつぶやきを, 機械学習を用いて陽性,陰性の二値分類を行う.次に陽性と判断された発言に対して多重線形回帰を適用し,推定を行った.
【結果・考察】線形回帰のデータには,2016年の3月~12月の間に群馬県でつぶやかれたものを用いた.2017年1月~4月における各都道府県の週毎の罹患率と推定結果を4週間毎に区切り,2つのデータの相関係数を求めた結果,患者数の上昇規模と推定精度との相関は0.13にとどまった.しかし,感染者数が上昇傾向にある区間かつ人口が200万程度の都道府県に限定した場合,患者数の上昇規模と推定精度との間に一定の相関がみられた(相関係数0. 38).このことから,人口200万程度の都道府県において1カ月で150人以上の患者の増加が見られるようなケースでは,強い確信を持って患者数の上昇規模の推定が可能であることが示された.
【手法】日本国内でSNSにおける感染性胃腸炎の症状に関するつぶやきを, 機械学習を用いて陽性,陰性の二値分類を行う.次に陽性と判断された発言に対して多重線形回帰を適用し,推定を行った.
【結果・考察】線形回帰のデータには,2016年の3月~12月の間に群馬県でつぶやかれたものを用いた.2017年1月~4月における各都道府県の週毎の罹患率と推定結果を4週間毎に区切り,2つのデータの相関係数を求めた結果,患者数の上昇規模と推定精度との相関は0.13にとどまった.しかし,感染者数が上昇傾向にある区間かつ人口が200万程度の都道府県に限定した場合,患者数の上昇規模と推定精度との間に一定の相関がみられた(相関係数0. 38).このことから,人口200万程度の都道府県において1カ月で150人以上の患者の増加が見られるようなケースでは,強い確信を持って患者数の上昇規模の推定が可能であることが示された.