15:30 〜 15:50
[3K5-OS-2b-01] 生成データが今後のデータセットに与える影響について
キーワード:生成AI
GAN,VAEといった深層生成モデルの登場から10年が経ち,実際のデータと区別のつかないような高度なデータ生成が可能となった.
さまざまな企業が競って「生成AI」を公開しているため,今では一般ユーザーも生成モデルによってデータを生成しており,大量の生成データがインターネット上に投稿されるようになった.
一方,このような深層学習の成功は,インターネット上から収集した大量の高品質なデータに大きく依拠している.
今後,これまで同様にデータセットを作成した場合には生成データの混入が不可欠だが,これはどのような問題を引き起こすのだろうか?
本稿では,筆者らの論文 [Hataya et al. 2023] をもとに,主にコンピュータビジョン分野における本問題を議論する.
さまざまな企業が競って「生成AI」を公開しているため,今では一般ユーザーも生成モデルによってデータを生成しており,大量の生成データがインターネット上に投稿されるようになった.
一方,このような深層学習の成功は,インターネット上から収集した大量の高品質なデータに大きく依拠している.
今後,これまで同様にデータセットを作成した場合には生成データの混入が不可欠だが,これはどのような問題を引き起こすのだろうか?
本稿では,筆者らの論文 [Hataya et al. 2023] をもとに,主にコンピュータビジョン分野における本問題を議論する.
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。