[4-F-2-01] 能動学習を活用した文献スクリーニング手法の提案
Systematic Review, Natural Language Processing, Active Learning
【背景と目的】 今なおアンメット・メディカル・ニーズは数多く存在しており,そのニーズに応えるには,医学や薬学における最先端の知見収集が不可欠である。そこで本研究では,知見収集時の労働集約的な文献の査読作業の効率化に着目し,能動学習を活用した文献のスクリーニング技術を開発した。 【方法】 アンメット・メディカル・ニーズに応じた文献スクリーニングは,観察研究やコホート研究から臨床像をとらえるため幅広いテーマ,例えば人種別の有病率やサブタイプ別に症状の発生率,重症化マーカー,予後に影響を与える関連因子などをスクリーニングする。幅広いテーマに対応するため,学習データの作成コストが高いことが課題である。そこで,文献のテキストを固定長のベクトルへ変換する変換ネットワークを査読者が付与した文献の採否ラベルによりファインチューニングし,採否の特徴をとらえたベクトルを生成する文ベクトル生成技術と少量の学習データにより機械学習モデルを学習し,機械学習モデルの予測結果が曖昧性の高いサンプルを優先的に選択し、査読者に提示しラベル付与を繰り返し行う能動学習を組み合わせた手法を提案した。 【結果】 提案手法を発症のメカニズムには不明点が多く治療薬が存在しない非アルコール性脂肪肝炎を対象としたシステマティックレビューで評価した。提案手法では,約75%の文献を査読することにより約95%の採用データをスクリーニングでき,比較手法と比べ約20%の工数を削減できた。また,比較手法と比べ能動学習の繰り返しが最も少なく,4回繰り返すことで95%の採用データのスクリーニングを達成することができ,繰り返し査読を要求することに対するユーザー負担が軽減できた。 【結論】 能動学習を活用した文献のスクリーニング技術を開発した。査読工数削減効果を確認し,提案手法が有効である見通しを得た。