Japan Association for Medical Informatics

[3-C-1-02] 日本語大規模言語モデルと言語理解ベンチマークの共進化

*Daisuke Kawahara1 (1. Waseda University)

large language models, natural language understanding, benchmarks

欧米を中心に、高性能な大規模言語モデルが構築され、その利活用によって社会変革が起きつつある。しかし、これらの大規模言語モデルは基本的に英語のテキストで学習されており、日本語の情報、特性や文化が十分に反映されているとは言い難い。また、少数の企業によって寡占されているため、経済安全保障上の問題も大きい。日本語において大規模言語モデルを健全に利活用するためには、日本語の情報を十分にカバーしたオープンな大規模言語モデルが必要である。我々はそのような大規模言語モデルの構築を進めると同時に、その言語理解能力を測るためのベンチマークの構築を進めることによって、これらの共進化を目指している。このベンチマークは、大規模言語モデルの性能を多面的に評価するための基準として用いられ、モデルの継続的な改良を促進する役割を果たす。この二つの構築・改良を繰り返すことで、日本語の大規模言語モデルを段階的に高性能化している。本講演では、この取組みを紹介するとともに、大規模言語モデルの利活用、医療分野を含むドメイン適応、さらには今後の展望について述べる。