[2-H-2-06] 少数枚の医用画像による画像認識モデル構築方法の検討
Image Analysis, Transfer Learning, AI
【背景・目的】従来,画像解析の前処理では,画像の特徴を強調するために大津法による画像の二値化や,微分フィルタを用いたエッジ抽出等の方法が用いられてきた.現在では,畳み込みニューラルネットワーク (CNN)やVision Transformer (ViT)等の高度なモデルが開発されているが,最適なモデル構築には大量の画像が必要になる.一方で,医用画像は撮影にかかる費用や労力,個人情報保護の観点から,収集可能な画像が少ない場合も多い.本研究では胸部X線画像を題材に,画像前処理や機械学習モデル構築で使われる手法を用いて,少ない画像で良好な画像認識モデルを構築する方法の検討を行った. 【方法】Kaggleで配布された心肥大の有無のラベル付きの胸部X線画像を用い,二値化処理やエッジ強調処理を行い,元の画像からの変化を確認した.元画像や処理後の画像から,転移学習,水平反転などのデータ水増し処理,アンダーサンプリング法などの手法を組み合わせながら,126枚の画像から心肥大の判定を行うモデルをViTとCNNモデルのひとつEfficient Netを用いて複数構築し,モデルの性能比較を行った. 【結果】少数の画像からの画像認識モデル構築においては,転移学習やデータの水増し処理,アンダーサンプリング法が性能の向上に有用だった.二値化処理やエッジ強調などの画像の前処理手法は,モデル性能の向上にはほとんど寄与しなかった.学習済みモデルを用いて転移学習した場合,Efficient NetとViTは同等の性能を示したのに対し,未学習モデルから学習させた場合,Efficient Netが優れていた. 【結論】大量の画像を集めにくく,ラベルの分布も偏りやすい医用画像において性能の良い画像認識モデルを構築するには,従来の画像前処理手法よりも機械学習モデル構築のための一般的な手法,特に転移学習が有効である可能性が示唆された.