[3-D-2-04] 構造化入力を可能とする音声入力システムと、構造化入力のための用語集整備について
香川大学ではこれまで、構造化入力を容易にするシステムに関する研究を行ってきた。
初期には、一般的に構造化入力に適さないと考えられている音声入力システムでの構造化入力について実装試験等を行った。
頻用される音声認識ソフトでは、膨大な文章サンプルに基づき予め作成したモデルから、確からしい単語の配列を推定する仕組みのため、ユーザーからの単語登録は難しいという背景があった。これについて、特定の検査レポートを想定した定型的な所見入力文を設定し、その定型文に基づいた発話を受け付けることで、構造化入力を可能とするシステムを作成した。
一方、上記のような構造化入力に必要なコンテンツの提供のためには、多量の用語数かつ複雑な構造を持つ用語集(コード集)の運用管理が必要となり、そのような運用を行うための用語集ハンドリングシステムの開発を行ってきた。
同システムは、オントロジーに代表される用語同士の関係性を持つことを想定し、また複数の担当者が役割を分担して、編集を行い、その過程の記録を残せるシステムとし、同システム上で行った作業の信頼性向上を目指している。更に近年、必要性が増している用語集間のマッピングを支援する機能を実装している。仮に二つの用語集のマッピングを継続的に行おうとすると、それぞれの用語集がアップデートするタイミングで差分抽出や再マッピングが必要となる。用語集を自施設でローカライズ(用語の追加・修正など)した場合にも、元の用語集のアップデートに合わせて再マッピングが発生しうる。
以上のような取り組みを通して、得られた知見について、実例に即して提示していきたい。
初期には、一般的に構造化入力に適さないと考えられている音声入力システムでの構造化入力について実装試験等を行った。
頻用される音声認識ソフトでは、膨大な文章サンプルに基づき予め作成したモデルから、確からしい単語の配列を推定する仕組みのため、ユーザーからの単語登録は難しいという背景があった。これについて、特定の検査レポートを想定した定型的な所見入力文を設定し、その定型文に基づいた発話を受け付けることで、構造化入力を可能とするシステムを作成した。
一方、上記のような構造化入力に必要なコンテンツの提供のためには、多量の用語数かつ複雑な構造を持つ用語集(コード集)の運用管理が必要となり、そのような運用を行うための用語集ハンドリングシステムの開発を行ってきた。
同システムは、オントロジーに代表される用語同士の関係性を持つことを想定し、また複数の担当者が役割を分担して、編集を行い、その過程の記録を残せるシステムとし、同システム上で行った作業の信頼性向上を目指している。更に近年、必要性が増している用語集間のマッピングを支援する機能を実装している。仮に二つの用語集のマッピングを継続的に行おうとすると、それぞれの用語集がアップデートするタイミングで差分抽出や再マッピングが必要となる。用語集を自施設でローカライズ(用語の追加・修正など)した場合にも、元の用語集のアップデートに合わせて再マッピングが発生しうる。
以上のような取り組みを通して、得られた知見について、実例に即して提示していきたい。