13:50 〜 14:10
[2R4-OS-12-02] データセットの品質評価に向けた半教師あり表現学習による属性値の回帰予測手法
キーワード:データ品質評価、変分オートエンコーダ、表現学習、回帰、属性
AIソフトウェアは従来のソフトウェアとは異なり,学習データから帰納的に開発されるため,高品質なデータセットを用意することが重要である.これまで我々は,複数の観点での潜在変数を抽出可能な変分オートエンコーダを利用して,潜在変数及び対応するデータの可視化により,データセットの多様な属性情報を取得可能な品質評価手法を提案している.そこでは潜在変数と属性の対応付けをユーザが手動で実施するため,手間がかかり属性値の定量化が困難という問題があった.そこで本稿ではその変分オートエンコーダを改良して,潜在変数から属性値を自動かつ定量的に予測可能な半教師あり表現学習手法を提案する.提案手法ではデータセットの一部に含まれる教師データの潜在変数から属性値を回帰予測できるように,損失関数に回帰式の適合度の指標である決定係数を含む項を追加し,決定係数が高くなるように学習する.帳票の手書き文字データセットに本手法を適用した結果,文字の太さや画数を予測可能な潜在変数を生成し,データセットの属性値別の出現頻度を把握してデータセットの客観的な品質評価に有効であることが分かった.
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。