2018年度人工知能学会全国大会(第32回)

講演情報

口頭発表

一般セッション » [一般セッション] 9.自然言語処理・情報検索

[1J2] 自然言語処理-自然言語処理応用(2)

2018年6月5日(火) 15:20 〜 17:00 J会場 (2F ロイヤルガーデンB)

座長:木村 泰知(小樽商科大学)

15:20 〜 15:40

[1J2-01] カーネル法に基づく疎な言語表現のための高速計算可能な共起尺度

〇横井 祥1,2、小林 颯介3、福水 健次4、乾 健太郎1,2 (1. 東北大学、2. 理研AIP、3. Preferred Networks、4. 統計数理研究所)

キーワード:自然言語処理、機械学習

コロケーション獲得や対話応答選択など,言語表現の間の関連の強さのモデル化は自然言語処理における基本的タスクである.デファクトの共起尺度である自己相互情報量(PMI)は疎なデータに適用すると大きな学習時間が必要となる.本講演では,PMIが「相互情報量へのペア(x,y)の貢献度」と捉えられることと対応付け,新しい共起尺度であるPointwise HSIC(PHSIC)を「カーネル法に基づく依存性尺度HSICへのペア(x,y)の貢献度」として提案する.PHSICは句や文などの疎な言語表現に適用でき,しかも行列計算に基づく高速な推定が可能である.実験では,PHSICを対話の応答文選択タスクに適用し,学習速度が既存尺度に比べ約100倍高速で,かつデータ数が少ないときにも予測精度の劣化が少ないことを示す.