[4-P1-2-03] 承認医薬品名における形態素構成の調査
Drug Name, Morphological Analysis, Natural Language Processing (NLP)
【背景】医療記録等のテキスト情報には有用な情報が含まれており、自然言語処理NLP等を用いて新知見を探索する研究が多く行われている。医療テキスト情報の中には医薬品名も存在するが、その活用は十分でない。医療テキスト情報中の医薬品名に関する情報から医薬品をどの程度特定可能であるかを検証するための基礎的検討として、医薬品名を医療薬学上の形態素へ分解するアルゴリズムを用いて、承認医薬品における医薬品名の形態素構成を調査したので報告する。
【方法】2018年12月9日に診療情報提供サービスのホームページよりダウンロードした承認医薬品リストを用いて、その医薬品名を我々が開発したアルゴリズムにより、「一般名」、「ブランド名」、「規格量」、「濃度」、「剤型」、「屋号」等に形態素分解した。解析結果において1つの「ブランド名」や「一般名」が指し示す製品品目数を調査した。また、「規格量」や「剤型」等が記述されている製品の割合についても調査を行った。
【結果】「ブランド名」が検出された医薬品は9,507品目(3,116種類)であった。「ブランド名」のみで一意に製品を特定できる医薬品は1,348品目(43.3%)であった。一方、「一般名」が検出された医薬品は6,930品目(1,149種類)であった。「ブランド名」が検出された医薬品において、「規格量」、「濃度」、「剤型」が検出された医薬品の割合は、それぞれ71.2%、15.7%、94.8%であった。「一般名」は検出された医薬品において、「屋号」が検出された医薬品の割合は69.2%であった。
【考察】本調査より、医療テキスト情報にブランド名や一般名のみ記述されている場合でも、一定の割合で一意に製品を特定できる可能性が示された。本調査結果を詳細に分析することで、医薬品名に関する限られた形態素情報から医薬品を特定するためのマスタを構築可能と考える。
【方法】2018年12月9日に診療情報提供サービスのホームページよりダウンロードした承認医薬品リストを用いて、その医薬品名を我々が開発したアルゴリズムにより、「一般名」、「ブランド名」、「規格量」、「濃度」、「剤型」、「屋号」等に形態素分解した。解析結果において1つの「ブランド名」や「一般名」が指し示す製品品目数を調査した。また、「規格量」や「剤型」等が記述されている製品の割合についても調査を行った。
【結果】「ブランド名」が検出された医薬品は9,507品目(3,116種類)であった。「ブランド名」のみで一意に製品を特定できる医薬品は1,348品目(43.3%)であった。一方、「一般名」が検出された医薬品は6,930品目(1,149種類)であった。「ブランド名」が検出された医薬品において、「規格量」、「濃度」、「剤型」が検出された医薬品の割合は、それぞれ71.2%、15.7%、94.8%であった。「一般名」は検出された医薬品において、「屋号」が検出された医薬品の割合は69.2%であった。
【考察】本調査より、医療テキスト情報にブランド名や一般名のみ記述されている場合でも、一定の割合で一意に製品を特定できる可能性が示された。本調査結果を詳細に分析することで、医薬品名に関する限られた形態素情報から医薬品を特定するためのマスタを構築可能と考える。