Japan Association for Medical Informatics

[4-A-2-02] 言語理解と言語生成

高村 大也1 (1. 産業技術総合研究所人工知能研究センター/東京工業大学)

人間の知識や経験は、言語という形で書籍や論文などに蓄えられている。しかし、世の中に存在する書籍や論文は莫大な量になり、人間が読める量を遥かに超えているため、言語化された知識や経験を十分に有効活用できているかというと疑わしい。このような問題において解決策の一つとして考えられるのが自然言語処理技術である。自然言語処理技術とは、人間の言語をコンピュータ(人工知能)に処理させる技術であり、言語理解と言語生成に大別される。言語理解の技術を用いることで、医学、薬学、材料科学など特定のドメインの論文や特許を人工知能に大量に読ませ、そこから知識を獲得することが可能になる。一方、言語生成は、数値データや画像データから、そこに含まれている内容を文章という形で表現する技術である。医療画像の読影レポートの自動作成などへの応用が期待されている。本講演では、自然言語処理の基本的な考え方について説明しつつ、いくつかの研究成果やプロジェクトに言及し、医療ドメインを含む多くのドメインへの、自然言語処理技術の適用可能性について議論する。