[4Rin1-09] データ値を考慮したText-to-SQLの検討
キーワード:Text-to-SQL
データベース(DB)に対する自然文質問をSQLクエリに変換するText-to-SQLというタスクが注目を集めている. 従来技術では,自然文質問とDBスキーマをインプットとしてSQLクエリを出力するが,DBのどの列がSQLクエリで使用されるかはデータ値を考慮せずに判断されている. データ値まで含めると数千, 数万単語からなるDBが存在するため, 複数列のデータ値をDBスキーマと同時に扱うことは難しい.
本研究では, 質問文の回答を得るSQLクエリにDBの列が使用されるか否かをデータ値も利用して判定する部分タスクを定義した.
Spiderデータセットで実験を行い, 事前学習言語モデルRoBERTaを本タスクに適応させることで,データ値を考慮することがSQLクエリに使用するDBの列の判定に効果があることを示した. 本タスクで学習した列判定モデルを従来のText-to-SQLモデルと組み合わせることで, 列の中のデータ値を考慮した上でDBから回答を取得するSQLクエリを予測できるようになると考られる.
本研究では, 質問文の回答を得るSQLクエリにDBの列が使用されるか否かをデータ値も利用して判定する部分タスクを定義した.
Spiderデータセットで実験を行い, 事前学習言語モデルRoBERTaを本タスクに適応させることで,データ値を考慮することがSQLクエリに使用するDBの列の判定に効果があることを示した. 本タスクで学習した列判定モデルを従来のText-to-SQLモデルと組み合わせることで, 列の中のデータ値を考慮した上でDBから回答を取得するSQLクエリを予測できるようになると考られる.
講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。