データ値を考慮したText-to-SQLの検討

加来 宗一郎; 西田 京介; 富田 準二

[4Rin1-09] データ値を考慮したText-to-SQLの検討

〇加来宗一郎¹、西田京介¹、富田準二¹ (1.日本電信電話株式会社)

キーワード：Text-to-SQL

データベース（DB）に対する自然文質問をSQLクエリに変換するText-to-SQLというタスクが注目を集めている. 従来技術では，自然文質問とDBスキーマをインプットとしてSQLクエリを出力するが，DBのどの列がSQLクエリで使用されるかはデータ値を考慮せずに判断されている. データ値まで含めると数千, 数万単語からなるDBが存在するため, 複数列のデータ値をDBスキーマと同時に扱うことは難しい．
本研究では, 質問文の回答を得るSQLクエリにDBの列が使用されるか否かをデータ値も利用して判定する部分タスクを定義した．
Spiderデータセットで実験を行い, 事前学習言語モデルRoBERTaを本タスクに適応させることで，データ値を考慮することがSQLクエリに使用するDBの列の判定に効果があることを示した. 本タスクで学習した列判定モデルを従来のText-to-SQLモデルと組み合わせることで, 列の中のデータ値を考慮した上でDBから回答を取得するSQLクエリを予測できるようになると考られる.

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

講演情報

[4Rin1] インタラクティブ2

[4Rin1-09] データ値を考慮したText-to-SQLの検討

パスワード