[4Xin1-09] FLとDC解析における通信コストと精度の比較
筑波大学附属病院とつくば市役所の統合データ解析を想定して
キーワード:データコラボレーション解析、連合学習、分散データ、プライバシー保護、医療データ
連合学習 (FL)は、インターネット通信を前提として研究や実践がなされてきた。しかし、現実の分散データは、その機密性からインターネットに常時接続を行うことが多くの場合できない。たとえば、医療機関や自治体、金融機関などがこの状況に直面している。ただし、FLは、メール転送や共有フォルダなどを活用することで、統合データ解析を行えるはずである。対して、インターネット通信を必要とせず、生データを共有しない統合データ解析を行うDC解析も提案され、FLとの技術比較がなされるようになってきた。そこで本研究では、生データが共有できず、また、インターネットに常時接続もできない現実の状況として、筑波大学附属病院の検歴データとつくば市役所の健診データを対象とし、糖尿病診断の指標として重要な空腹時血糖値を予測する機械学習モデルを構築する。そして、各機関における個別解析、インターネット常時接続をしないFL、DC解析の3つの解析手法の精度や計算コストの比較を行う。結果として、FLとDC解析は個別解析よりも予測精度を向上させた。DC解析は計算量がFLの2倍だったが、実行時間が1/3でFLと同程度の精度を達成した。
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。