Japan Association for Medical Informatics

[4-G-1-5] AIによる画像診断に向けた、腎病理糸球体画像の所見一致度の評価

山口 亮平1, 堂本 裕加子2, 宇於崎 宏3, 清水 章4, 長田 道夫5, 嶋本 公徳6, 河添 悦昌1,6, 大江 和彦1,6 (1.東京大学大学院 医学系研究科 医療情報学分野, 2.東京大学大学院医学系研究科人体病理学・病理診断学分野, 3.帝京大学医学部病理学講座, 4.日本医科大学 解析人体病理学, 5.筑波大学 腎・血管病理学, 6.東京大学医学部附属病院 企画情報運営部)

<背景> 近年、医療画像の診断においてDeep Learningをはじめとする人工知能関連技術が導入されてきているが、その学習には質の高い正解ラベル付きデータが必要である。ラベル付けを行うためには正解となる基準が必要であるが、腎生検の糸球体病理画像には、そのような基準はない。今回我々は、腎生検の糸球体病理画像における所見項目について、定義を明確にした上で医師が所見付けを行い、その一致度を評価した。<方法> PAS染色でつけるべき12種類の糸球体所見項目ならびにその定義を作成した。IgA腎症に限定した所見定義であるOxford分類を参考に、一部所見項目の追加と定義変更を行った。東大病院の腎病理デジタルスライド画像から糸球体画像を抽出し、その中からランダムに選択した100枚の画像を対象とし、5人の専門医が所見付けを行った。所見付けはお互いの所見が見えない状態で行った。所見付け終了後、5人のうちのすべての2人の組み合わせにおける所見一致度をκ係数として算出し、各所見項目における平均値を評価に用いた。<結果> 各所見項目においてκ係数の平均値は0.16から0.76まで大きくばらついていた。もともとOxford分類に採用されている所見項目は高い傾向にあり、sclerosisやcellular crescentなどの所見項目はκ係数の平均値は0.4(中等度の一致)を超えていたが、他のmesangiolysisやadhesionなどの所見項目の平均値は低かった。いくつかの所見項目においては、質の高い正解ラベルつきデータを得るには不十分なκ係数であり、所見項目の定義に改善の余地があると考えられた。今後、各所見項目において高い一致率が得られるよう検討が必要である。