差分プライバシー基準を満たした機械学習モデルにおけるプライバシーデータ暴露の回避

小松 史弥

16:20 〜 16:40

[1D5-GS-11-01] 差分プライバシー基準を満たした機械学習モデルにおけるプライバシーデータ暴露の回避

〇小松史弥¹、竹川高志¹ (1. 工学院大学)

キーワード：差分プライバシー、プライバシー保護、機械学習

近年，機械学習により様々なデータ活用が可能になった．一方，データの利用機会が増加することで，機械学習モデルからのデータ侵害について指摘されている．例えば電子メールの作成中に，入力候補を提示してくれるモデルについて考える．ユーザーが作成したメールの本文を用いて学習し，次に入力する候補を予測して生成する．このモデルでクレジットカードに関するテキストをユーザーが入力したとき，学習に用いられた誰かのクレジットカード番号が提示されてしまうことはデータ侵害である．本研究ではデータ侵害対策として，TensorFlow Privacyというライブラリで提供されている差分プライバシーを満たした最適化アルゴリズムであるDP-Adamを用いて，RNNによるテキスト生成タスクに取り組んだ．ここで個人情報に見立てたダミーデータの暴露を防ぐことができるかを実験した．結果，差分プライバシーを満たしたモデルではダミーデータ暴露の回避が確認できた．また過学習対策として用いられるL1正則化でもダミーデータの暴露が回避された．しかし，L1正則化モデルが生成したテキストには，存在しない単語が含まれていた．

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

講演情報

[1D5-GS-11] AIと社会：一般

[1D5-GS-11-01] 差分プライバシー基準を満たした機械学習モデルにおけるプライバシーデータ暴露の回避

パスワード