[發明專利]文本轉SQL模型的優化方法及系統在審
| 申請號: | 202110476255.5 | 申請日: | 2021-04-29 |
| 公開(公告)號: | CN113177123A | 公開(公告)日: | 2021-07-27 |
| 發明(設計)人: | 俞凱;曹瑞升;陳露 | 申請(專利權)人: | 思必馳科技股份有限公司 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F16/242;G06F40/151;G06F40/211;G06F40/284;G06F40/30;G06N3/04;G06N3/08 |
| 代理公司: | 北京商專永信知識產權代理事務所(普通合伙) 11400 | 代理人: | 黃謙;車江華 |
| 地址: | 215123 江蘇省蘇州市蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本 sql 模型 優化 方法 系統 | ||
本發明實施例提供一種文本轉SQL模型的優化方法。該方法包括:將從文本的異構圖以及異構圖對應的線圖中確定的關系特征輸入至隱藏層;在隱藏層中,通過兩個關系圖注意力網絡分別對節點特征和邊特征迭代更新,將迭代更新后的節點特征輸入至輸出層;在輸出層中確定對應的SQL。本發明實施例還提供一種文本轉SQL模型的優化系統。本發明實施例在異構圖的編碼任務中,通過引入異構圖的線圖結構,豐富語義特征,對邊之間的拓撲結構進行建模,進一步提升對異構圖的編碼能力,同時對節點和邊雙向建模,使得在面對復雜的連接情況時提升性能。
技術領域
本發明涉及智能語音領域,尤其涉及一種文本轉SQL模型的優化方法及系統。
背景技術
文本轉SQL的任務旨在給定相應的數據庫模式的情況下將自然語言問題轉換為相應的SQL查詢語句。
為了實現文本轉SQL任務,通常會使用SQLNet,TypeSQL,GNNSQL,EditSQL和RATSQL等文本轉SQL的模型。
這些模型都旨在將輸入的自然語言文本和數據庫模式一起進行聯合編碼,然后通過端到端的方式轉化成目標輸出SQL程序。數據庫模式包括數據庫中每一個數據表的名稱、表中每一列的名稱、數據表的主鍵的集合和數據表之間的外鍵連接信息。數據庫中的表和列統稱為模式條目(schema items),它們根據從屬關系、主鍵、外鍵可以構成數據庫的模式圖(schema graph)。根據不同模型的編碼方式,可以細分為:
(1)SQLNet在聯合編碼時以問句作為上下文,計算每一個模式條目的上下文向量來加強對數據庫模式的編碼。
(2)TypeSQL進一步地考慮每一個輸入單詞(包括問句和模式條目)的類型信息,比如整數、浮點數、布爾類型等,對于問句里的單詞,還考慮是否和某一個模式條目在字符串形式上匹配,稱之為模式鏈接(schema linking)。這些類型和匹配信息作為額外的輸入特征向量來加強聯合編碼。
(3)GNNSQL考慮模式圖的圖連接信息,利用一個關系圖卷積神經網絡來加強數據庫模式的編碼。
(4)EditSQL在SQLNet的基礎之上,進一步地以數據庫模式作為上下文,計算問句中每一個單詞的上下文向量,即考慮問句和模式條目之間的雙向注意力。
(5)RATSQL借用機器翻譯中相對位置編碼的方法,對圖注意力網絡進行修改,考慮了不同類型的節點之間(問句、表、列)的不同關系。
在實現本發明過程中,發明人發現相關技術中至少存在如下問題:
SQLNet和EditSQL方法都只對節點的特征表示進行建模,在計算注意力時完全忽略了對節點之間關系的建模,即忽略了不同類型的邊特征。
GNNSQL方法只考慮了數據庫模式之間的圖連接信息,沒有考慮問句和數據庫模式之間的語義關聯信息。
TypeSQL和RATSQL方法一方面沒有考慮邊與邊之間的結構信息,即缺少對有效元路徑(meta-path)的挖掘;另一方面沒有對局部和全局的關系進行區分,只是單純地利用一個全連接圖。
發明內容
為了至少解決現有技術中這些方法都忽視了有向圖中邊與邊之間的連接信息,要么只考慮了局部的關系,要么利用一個全連接圖僅考慮全局關系,忽視了對局部關系的強調的問題。
第一方面,本發明實施例提供一種文本轉SQL模型的優化方法,包括:
將從文本的異構圖以及所述異構圖對應的線圖中確定的關系特征輸入至隱藏層,其中,所述關系特征至少包括:所述異構圖確定的節點特征以及所述線圖確定的邊特征,以提升所述關系特征的語義;
在所述隱藏層中,通過兩個關系圖注意力網絡分別對所述節點特征和所述邊特征迭代更新,將迭代更新后的節點特征輸入至輸出層;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于思必馳科技股份有限公司,未經思必馳科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110476255.5/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種危險廢物燃燒爐
- 下一篇:網絡測繪方法、裝置、電子設備及存儲介質





