[4-D-2-6] 電子カルテ診療録に対する機械学習を用いた重要キーワード抽出機能の開発と今後の診療支援機能への展望
【目的】急激な科学技術の発展で、医療現場もデジタル化が進み、多種多様な医療情報(リアルワールドデータ)が蓄積されている。これらのデータと、革新的に進化しているAIを組み合わせて医療情報を評価・分析し、実際の医療現場へ適用することで、患者に最適な医療を提供する次世代の高度医療が強く期待されている。高度な判断が可能なAIの構築のためには、詳細で時系列にわたる臨床情報を活用する必要があるが、これらの情報は文章記載などの構造化されていない部分も多く、電子カルテ内のテキストや数値、医療論文での記述、遺伝子情報、診断画像といった多種多様の膨大なデータを統合・連携して実践応用するためのAI技術はいまだ確立されていない。【方法】 フリーテキストで記載される電子カルテ診療録は、診療ガイドラインのような整理された自然文ではなく、文字と数値の組合せや、口語表現が多いだけでなく、さらに簡略語や誤字など曖昧性を含んだ内容であることが多く、従来の機械学習による言葉の出現度や前後の文脈のベクトル抽出による単語の意味抽出や文書の類似性把握を行うことは困難であった。そこで、電子カルテ診療録そのものの構造パターンを機械学習するだけでなく、診療ガイドラインや各種医療辞書から抽出した独自のナレッジグラフを組合せ、電子カルテから重要キーワードと関連用語を抽出し、意味づけを行う技術を研究・開発している。【結果・考察】 電子カルテ診療録において時系列化されたデータとSOAPの関連性を考慮しながら重要キーワードを抽出・構造化し、大量データを学習することで、電子カルテのフェノタイピングを実現することが可能となる。その要素技術を応用し、今後、診療計画のサジェッションや様々なレポートの自動作成などに利用可能と考える。今回研究・開発するAI機能が医療現場の医師の作業負および患者の経済・時間的負荷の軽減に繋がることが期待される。