[3-P1-3-01] 少数カラー眼底写真による緑内障推定精度の検証
Ophthalmology, Glaucoma, Deep learning, Fundus photography
【目的】眼科領域における畳み込みニューラルネットワーク(CNN)を用いた眼疾患の推定は, 数千例以上の症例を同一機器で測定したデータを学習させていることが多く, 少数のデータで CNN の性能評価を行った例や眼底カメラの機種別で予測精度検証した報告は少ない. 本研究では少数のカラー眼底写真を用いた CNN による緑内障眼の予測精度および別機種の眼底カメラで撮影した眼底写真における緑内障眼の予測精度を検証した.
【方法】実験1では, 緑内障患者 130 眼, 健常者 130 眼のカラー眼底写真 (Topcon) を訓練データ各90枚, 検証データ各40枚に振り分けた. 視神経乳頭が含まれる 512×512 px を抽出し, 128×128 px に縮小した. CNN モデルは VGG16 を改造した. 学習回数は 100 回とした. 元画像のみを使用した場合を対照として, 訓練用画像を各3000枚に水増しした場合(DAC)の受信者動作特性曲線下面積(AUC)を比較した. 水増ししたカラー画像をグレースケール画像に変換した場合(DAG)とDACのAUCを比較した. 実験2では, 別機種 (Nidek) で撮影した緑内障眼の眼底写真79枚をDAGとDACモデルに予測させた.
【結果】実験1 では, DAC(0.751)は対照(0.607)よりもAUCが有意に高かった(P=0.024). DAG(0.796)はDACよりもAUCが有意に高かった(P = 0.031). 実験2では, DAG(0.304)の正解率はDAC(0.797)よりも有意に低かった (P<0.001).
【結論】少数の緑内障眼のカラー眼底写真を深層学習に使用する際は, 画像の水増しとグレースケール化を組み合わせると判定精度が向上することが示唆された. 一方で, 予測精度は眼底カメラの機種に影響される可能性があることが示唆された.
【方法】実験1では, 緑内障患者 130 眼, 健常者 130 眼のカラー眼底写真 (Topcon) を訓練データ各90枚, 検証データ各40枚に振り分けた. 視神経乳頭が含まれる 512×512 px を抽出し, 128×128 px に縮小した. CNN モデルは VGG16 を改造した. 学習回数は 100 回とした. 元画像のみを使用した場合を対照として, 訓練用画像を各3000枚に水増しした場合(DAC)の受信者動作特性曲線下面積(AUC)を比較した. 水増ししたカラー画像をグレースケール画像に変換した場合(DAG)とDACのAUCを比較した. 実験2では, 別機種 (Nidek) で撮影した緑内障眼の眼底写真79枚をDAGとDACモデルに予測させた.
【結果】実験1 では, DAC(0.751)は対照(0.607)よりもAUCが有意に高かった(P=0.024). DAG(0.796)はDACよりもAUCが有意に高かった(P = 0.031). 実験2では, DAG(0.304)の正解率はDAC(0.797)よりも有意に低かった (P<0.001).
【結論】少数の緑内障眼のカラー眼底写真を深層学習に使用する際は, 画像の水増しとグレースケール化を組み合わせると判定精度が向上することが示唆された. 一方で, 予測精度は眼底カメラの機種に影響される可能性があることが示唆された.