17:30 〜 17:50
[2L6-OS-19b-01] テキスト駆動型属性操作に基づく生成的自動データ拡張の検討
キーワード:データセット品質、生成AI、属性操作、自動データ拡張、方策最適化
AIソフトウェアは従来のソフトウェアとは異なり,学習データから帰納的に開発されるため,高品質な学習データを用意することが重要である.従来の自動データ拡張手法では,主に元のデータの回転・切り抜き等の直接的な操作,または元のデータに対応する潜在変数の操作によってデータ拡張が実施され,データセットが有する多様で解釈可能な属性情報を操作してデータ拡張を最適化することは考慮されていなかった.そこで本稿では,元のデータセットの属性値をテキスト形式で表現し,それらの属性値を操作することで,属性値別のデータの十分性・被覆性等を確保して新たなデータを生成する自動データ拡張手法を提案する.提案手法では,属性値別の判別精度や,テキストデータの自然さを最大化するテキスト属性操作の方策を学習することにより,データ拡張を最適化する.これにより,データセット全体の品質が向上すると期待される.今後,提案手法の実装と評価を行い,その有効性を検証する予定である.
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。