2024年度 人工知能学会全国大会(第38回)

講演情報

オーガナイズドセッション

オーガナイズドセッション » OS-2 データセットとベンチマークの技術的・社会的な視点

[3K5-OS-2b] データセットとベンチマークの技術的・社会的な視点

2024年5月30日(木) 15:30 〜 16:50 K会場 (44会議室)

オーガナイザ:鈴木 健二(ソニーグループ株式会社)、原 聡(大阪大学)、谷中 瞳(東京大学)、菅原 朔(国立情報学研究所)

15:30 〜 15:50

[3K5-OS-2b-01] 生成データが今後のデータセットに与える影響について

〇幡谷 龍一郎1 (1. 理化学研究所)

キーワード:生成AI

GAN,VAEといった深層生成モデルの登場から10年が経ち,実際のデータと区別のつかないような高度なデータ生成が可能となった.
さまざまな企業が競って「生成AI」を公開しているため,今では一般ユーザーも生成モデルによってデータを生成しており,大量の生成データがインターネット上に投稿されるようになった.
一方,このような深層学習の成功は,インターネット上から収集した大量の高品質なデータに大きく依拠している.
今後,これまで同様にデータセットを作成した場合には生成データの混入が不可欠だが,これはどのような問題を引き起こすのだろうか?
本稿では,筆者らの論文 [Hataya et al. 2023] をもとに,主にコンピュータビジョン分野における本問題を議論する.

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード