2020年度 人工知能学会全国大会(第34回)

講演情報

インタラクティブセッション

[4Rin1] インタラクティブ2

2020年6月12日(金) 09:00 〜 10:40 R01会場 (jsai2020online-2-33)

[4Rin1-09] データ値を考慮したText-to-SQLの検討

〇加来 宗一郎1、西田 京介1、富田 準二1 (1.日本電信電話株式会社)

キーワード:Text-to-SQL

データベース(DB)に対する自然文質問をSQLクエリに変換するText-to-SQLというタスクが注目を集めている. 従来技術では,自然文質問とDBスキーマをインプットとしてSQLクエリを出力するが,DBのどの列がSQLクエリで使用されるかはデータ値を考慮せずに判断されている. データ値まで含めると数千, 数万単語からなるDBが存在するため, 複数列のデータ値をDBスキーマと同時に扱うことは難しい.
本研究では, 質問文の回答を得るSQLクエリにDBの列が使用されるか否かをデータ値も利用して判定する部分タスクを定義した.
Spiderデータセットで実験を行い, 事前学習言語モデルRoBERTaを本タスクに適応させることで,データ値を考慮することがSQLクエリに使用するDBの列の判定に効果があることを示した. 本タスクで学習した列判定モデルを従来のText-to-SQLモデルと組み合わせることで, 列の中のデータ値を考慮した上でDBから回答を取得するSQLクエリを予測できるようになると考られる.

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード