[3-L-3-PP9-2] X線画像を用いたNeural Networkの学習手法に関する基礎的研究
背景・目的
医用画像は自然画像と比較して収集可能な枚数が少なく、データ拡張などの手法によって枚数を増加させる必要がある。しかしながら、Neural Networkの学習モデルを構築する際、最初から大量の医用画像を用いて学習させることは、データの拡張の手間もあり容易な方法とは言い難い。そこで本研究では医用画像におけるNeural Networkの学習の効果に影響を与える要因を明らかにすることを目的とし、X線画像の識別時のNeural Networkの層数、医用画像の部位、画像サイズ、画像の回転による影響の検討を行なった。
対象・方法
本研究で用いたX線画像は、副鼻腔画像(ウォーターズ法)、頭部正面撮影(PA方向)、膝正面画像、肘正面画像、胸部正面画像(PA方向)の5種類(それぞれ以下、W、H、K、E、Cとする)とした。各部位の画像は500枚とし、学習用及び検証用の画像をそれぞれ450枚、50枚とした。画像識別及び学習モデルの構築にはNEC社製画像学習ソフトウェアRapidを使用した。まず初めに事前実験として、画像の学習回数を表すエポック数(1〜30)の決定を行なった。次いで、本実験としてX線画像(5部位、計2,250枚)を、Neural Networkの層数を4、19、34、64としてそれぞれ学習モデルを構築し、残りの250枚を検証用として正答率を求めた。さらに画像のサイズによる学習への影響を検討するために、画像のサイズを元画像(1,020×1,275)の10%にした条件で同様に正答率を求めた。最後に、学習のロバストネス性を検証するために、画像を90度回転させた条件で正答率を求めた。
結果・考察
本研究結果から、層数4、19、34、64における部位W、H、K、E、Cの画像の識別率は画像のサイズによらず全て100%となった。画像の向き90度に対する識別率は、画像サイズが100%でW(84%-90%)、H(0%-10%)、K(2%-18%)、E(0%-16%)、C(36%-100%)、10%でW(84%-88%)、H(0%-14%)、K(2%-18%)、E(0%-18%)、C(34%-100%)となりWは層数に関わらず画像の回転に対して高い識別率を維持し、H、K、Eについては層数によらず低い識別率となり、Cに関しては総数が増加するにつれ識別率が低下した。
医用画像は自然画像と比較して収集可能な枚数が少なく、データ拡張などの手法によって枚数を増加させる必要がある。しかしながら、Neural Networkの学習モデルを構築する際、最初から大量の医用画像を用いて学習させることは、データの拡張の手間もあり容易な方法とは言い難い。そこで本研究では医用画像におけるNeural Networkの学習の効果に影響を与える要因を明らかにすることを目的とし、X線画像の識別時のNeural Networkの層数、医用画像の部位、画像サイズ、画像の回転による影響の検討を行なった。
対象・方法
本研究で用いたX線画像は、副鼻腔画像(ウォーターズ法)、頭部正面撮影(PA方向)、膝正面画像、肘正面画像、胸部正面画像(PA方向)の5種類(それぞれ以下、W、H、K、E、Cとする)とした。各部位の画像は500枚とし、学習用及び検証用の画像をそれぞれ450枚、50枚とした。画像識別及び学習モデルの構築にはNEC社製画像学習ソフトウェアRapidを使用した。まず初めに事前実験として、画像の学習回数を表すエポック数(1〜30)の決定を行なった。次いで、本実験としてX線画像(5部位、計2,250枚)を、Neural Networkの層数を4、19、34、64としてそれぞれ学習モデルを構築し、残りの250枚を検証用として正答率を求めた。さらに画像のサイズによる学習への影響を検討するために、画像のサイズを元画像(1,020×1,275)の10%にした条件で同様に正答率を求めた。最後に、学習のロバストネス性を検証するために、画像を90度回転させた条件で正答率を求めた。
結果・考察
本研究結果から、層数4、19、34、64における部位W、H、K、E、Cの画像の識別率は画像のサイズによらず全て100%となった。画像の向き90度に対する識別率は、画像サイズが100%でW(84%-90%)、H(0%-10%)、K(2%-18%)、E(0%-16%)、C(36%-100%)、10%でW(84%-88%)、H(0%-14%)、K(2%-18%)、E(0%-18%)、C(34%-100%)となりWは層数に関わらず画像の回転に対して高い識別率を維持し、H、K、Eについては層数によらず低い識別率となり、Cに関しては総数が増加するにつれ識別率が低下した。