Japan Association for Medical Informatics

[3-H-1-CS3-1] NICTにおける自然言語処理研究と医療応用の可能性

鳥澤 健太郎 ((国研)情報通信研究機構・ユニバーサールコミュニケーション研究所(UCRI)・データ駆動知能システム研究センター(DIRECT))

近年、自然言語処理技術は劇的な進歩を遂げている。情報通信研究機構(NICT)は総務省傘下の国立研究開発法人であり、過去数十年にわたり自然言語処理の研究開発を実施してきており、こうした進歩の一翼を担ってきたと自負している。具体的にNICTでは、スマートフォン上の多言語音声翻訳システムVoiceTra(http://voicetra.nict.go.jp)や、大規模災害の被災状況をSNSにおける一般ユーザの発信を元に分析する対災害SNS情報分析システムDISAANA/D-SUMM(https://disaana.jp, https://disaana.jp/d-summ/)、40億ページのWeb上の情報を元に様々な質問に回答するWISDOM X(http://wisdom-nict.jp)等の一般公開も行なっており、ビジネス化、実用化への動きも加速しているところである。現在では、さらに次世代のメディア技術として、一般ユーザと音声で対話を行う対話エージェント「WISDOMちゃん」(仮称)の開発を進めているが、これは現在実用化が行われているいわゆるAIスピーカーとは異なり、膨大なWeb情報と深層学習を用いて、話題を限らず、多様な対話が可能な対話エージェントである。本講演では、これらのシステムの解説を通して、自然言語処理の現状、特に機械学習の一種である深層学習の進歩による研究スタイルの変化や、それがもたらす可能性と限界について述べる。一般の方々の多くは自然言語処理の究極の姿として、ユーザが考え入力した質問に、テキストに書かれた適切な回答を返す質問応答システムを思い浮かべると思われるが、現在の自然言語処理研究のスコープはそうした質問応答システムの域を超え、有用な質問をユーザの入力を待たずに自動生成してしまう試みや、テキストに書かれていない仮説を導き出すといった試みも始まっており、より高度なユーザ支援の実現を狙い始めている。本講演ではそうした高度なユーザ支援を実現するための研究戦略や、そうした技術の医療応用の試みや可能性、そして医療自然言語処理を実現する上での障害であるデータの量についても議論する。