2025年度 人工知能学会全国大会(第39回)

講演情報

ポスターセッション

ポスターセッション » ポスターセッション

[1Win4] ポスターセッション1

2025年5月27日(火) 15:30 〜 17:30 W会場 (イベントホールD-E)

[1Win4-91] 小規模言語モデルによる社内文書内個人情報抽出を用いた情報セキュリティ管理手法の検討

〇山口 智之1、野口 十夢1 (1.株式会社村田製作所)

キーワード:固有表現抽出、自然言語処理

大規模言語モデル(LLM)の発展・普及に伴い、企業に蓄積した社内文書をもとにした文書生成や情報検索による業務効率化の用途が大きく期待されている。一方で、高性能なLLMの多くはサービスプロバイダの準備するAPIを利用するため、入力情報が外部に送信されるリスクが存在し、プライバシー保護規制や企業コンプライアンスの観点からその活用の障壁となっている。企業内におけるLLMの活用には、入力に含まれる機密性の高い情報のリスク管理を行うことが必要不可欠である。
本研究は、企業の有する個人情報(PII)を対象に、APIを利用したLLMの入力に含まれるPIIを抽出・マスキング可能とする情報セキュリティ管理手法開発を目的としている。ローカル環境で動作する小規模言語モデル(SLM)に対し、社内で構築したPIIデータセットを用いたPEFT(Parameter-Efficient Fine-Tuning)を実施、その性能を確認した。SLMによるPII抽出・マスキングは実用上十分な精度が確認されたため、企業内でのセキュアなLLMの利用に期待のもてる結果となった。

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード