2024年度 人工知能学会全国大会(第38回)

講演情報

オーガナイズドセッション

オーガナイズドセッション » OS-2 データセットとベンチマークの技術的・社会的な視点

[3K1-OS-2a] データセットとベンチマークの技術的・社会的な視点

2024年5月30日(木) 09:00 〜 10:40 K会場 (44会議室)

オーガナイザ:鈴木 健二(ソニーグループ株式会社)、原 聡(大阪大学)、谷中 瞳(東京大学)、菅原 朔(国立情報学研究所)

10:20 〜 10:40

[3K1-OS-2a-04] 生成AI開発におけるデータセットを構築・利用・公開する際に問題となる法規制とそのクリア方法

著作権法と個人情報保護法を中心に

〇柿沼 太一1 (1. STORIA法律事務所)

[[オンライン]]

キーワード:著作権法、個人情報保護法、法律、データセット

・ 本稿においては、生成AI開発のためのデータセットを構築・利用・公開する際に問題となる法規制とそのクリア方法について、特によく問題となる法規制(著作権法及び個人情報保護法)の概要について解説をした後に、収集対象データをテキスト、画像、音声に分けて個別に検討する。
・ 日本著作権法上、データセットの構築・利用のために他人の著作物を収集・複製することは、アカデミアに限らず民間企業においても原則として自由である。もっとも近時、特にウェブ上のテキストデータを大規模に収集する行為に関して批判的な意見も増えてきており注意が必要である。
・ 日本の個人情報保護法上、個人情報を収集する行為については、原則として不正な手段による個人情報の取得禁止と利用目的の特定・公表等のみが義務づけられている。そのため、AI開発のためのデータセット構築の際に個人情報を含むデータを収集する点については要配慮個人情報の取得を除いて大きな法的障害はないが、個人情報を含むデータセットを公開する場合にはいくつかの点に留意が必要である。

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード