2022年度 人工知能学会全国大会(第36回)

講演情報

一般セッション

一般セッション » GS-6 言語メディア処理

[3C3-GS-6] 言語メディア処理:生成

2022年6月16日(木) 13:30 〜 14:50 C会場 (Room C-2)

座長:赤間 怜奈(東北大学)[現地]

14:10 〜 14:30

[3C3-GS-6-03] 言語モデルから生成されたサンプルを選択的に利用する一般化ゼロショットテキスト分類

〇河南 壮太1、矢野 太郎2、竹岡 邦紘2、小山田 昌史2、岡留 剛1 (1. 関西学院大学、2. 日本電気株式会社)

キーワード:テキスト分類、ゼロショット分類、データ拡張、テキスト生成

一般化ゼロショットテキスト分類は,教師データが存在しないクラスである未知クラスを含むクラス集合へテキストを分類するタスクであり,ニュースや商品分類などに幅広く応用される.一般化ゼロショットテキスト分類の既存のアプローチとして,未知クラスに対する知識を分類器に獲得させるために,言語モデルを用いて未知クラスのサンプルを擬似的に生成し学習に組み込む手法がある.しかし,この既存手法では,対象ドメイン外も含むデータから獲得した情報をもとに文の生成を行うため,対象ドメインに応じたサンプルのみを生成できず,それにより分類器の学習に悪影響がある.本稿では,分類器にドメイン外のサンプルが入力された時,各クラスへの確率が総じて低くなるという仮定を元に,言語モデルから生成されたサンプル集合からドメイン外のサンプルを削除し,対象ドメインに応じたサンプルのみからなるデータを再構築することで,分類性能を向上させる一般化ゼロショットテキスト分類法を提案する.実データを用いた実験により,ベースラインに対する提案手法の分類性能の改善を示す.

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード