[發明專利]用于生成語言轉換模型的方法和裝置有效
| 申請號: | 201911335116.X | 申請日: | 2019-12-23 |
| 公開(公告)號: | CN111008213B | 公開(公告)日: | 2023-05-26 |
| 發明(設計)人: | 張傲;張帥;王麗杰;孫珂;李婷婷 | 申請(專利權)人: | 百度在線網絡技術(北京)有限公司 |
| 主分類號: | G06F16/242 | 分類號: | G06F16/242 |
| 代理公司: | 北京英賽嘉華知識產權代理有限責任公司 11204 | 代理人: | 王達佐;馬曉亞 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 生成 語言 轉換 模型 方法 裝置 | ||
本公開的實施例公開了用于生成語言轉換模型的方法和裝置。該方法的一具體實施方式包括:將自然語言查詢語句輸入初始模型,得到實際結構化查詢語句,判斷實際結構化查詢語句是否滿足預設的匹配條件,確定實際結構化查詢語句與自然語言查詢語句對應的目標結構化查詢語句的匹配值,基于該匹配值,更新該初始模型的網絡參數,生成語言轉換模型。該實施方式將實際結構化查詢語句與目標結構化查詢語句的匹配值應用于生成語言轉換模型的過程中,提高了語言轉換模型輸出的準確性。
技術領域
本公開的實施例涉及計算機技術領域,具體涉及用于生成語言轉換模型的方法和裝置。
背景技術
隨著大數據時代的到來,數據庫存儲了大量的個人或者企業的生產運營數據,通常查詢數據庫中的數據需要通過結構化查詢語言(SQL,Structured?Query?Language)來進行交互。例如在問答場景中,用戶有大量的查詢訴求,需要通過結構化查詢語言來滿足。
NL2SQL(Natural?Language?to?SQL)是一項將用戶的自然語句轉為可執行SQL語句的技術,有很大的實際應用價值,對改善用戶與數據庫之間的交互方式有很大意義。
發明內容
本公開的實施例提出了用于生成語言轉換模型的方法和裝置。
第一方面,本公開的實施例提供了一種用于生成語言轉換模型的方法,該方法包括:將自然語言查詢語句輸入初始模型,得到實際結構化查詢語句;判斷實際結構化查詢語句是否滿足預設的匹配條件,確定實際結構化查詢語句與自然語言查詢語句對應的目標結構化查詢語句的匹配值;基于匹配值,更新初始模型的網絡參數,生成語言轉換模型。
在一些實施例中,匹配值包括第一匹配值;判斷實際結構化查詢語句是否滿足預設的匹配條件,確定實際結構化查詢語句與自然語言查詢語句對應的目標結構化查詢語句的匹配值,包括:判斷實際結構化查詢語句中的第一指令關鍵詞與目標結構化查詢語句中的第二指令關鍵詞是否相同,以及判斷第一指令關鍵詞在實際結構化查詢語句中的排列順序與第二指令關鍵詞在目標結構化查詢語句中的排列順序是否相同,得出第一判斷結果;基于第一判斷結果,確定實際結構化查詢語句與目標結構化查詢語句的匹配值。
在一些實施例中,匹配值包括第二匹配值;判斷實際結構化查詢語句是否滿足預設的匹配條件,確定實際結構化查詢語句與自然語言查詢語句對應的目標結構化查詢語句的匹配值,包括:判斷實際結構化查詢語句中子句中的對象、與目標結構化查詢語句中同一類型子句中的對象是否相同,得出第二判斷結果;基于第二判斷結果,確定實際結構化查詢語句與自然語言查詢語句對應的目標結構化查詢語句的匹配值。
在一些實施例中,匹配值包括第三匹配值;判斷實際結構化查詢語句是否滿足預設的匹配條件,確定實際結構化查詢語句與自然語言查詢語句對應的目標結構化查詢語句的匹配值,包括:判斷實際結構化查詢語句中的子句中的對象的第一數據類型、與目標結構化查詢語句中同一類型子句中的同一類型對象所關聯的第二對象的第二數據類型是否相同,得出第三判斷結果;基于第三判斷結果,確定實際結構化查詢語句與自然語言查詢語句對應的目標結構化查詢語句的匹配值。
在一些實施例中,匹配值包括第四匹配值;判斷實際結構化查詢語句是否滿足預設的匹配條件,確定實際結構化查詢語句與自然語言查詢語句對應的目標結構化查詢語句的匹配值,包括:判斷實際結構化查詢語句中的條件子句中的記錄值的列號與目標結構化查詢語句的條件子句中的字段的列號是否相同,得出第四判斷結果;基于第四判斷結果,確定實際結構化查詢語句與自然語言查詢語句對應的目標結構化查詢語句的匹配值。
第二方面,本公開的實施例提供了一種用于生成語言轉換模型的裝置,該裝置包括:輸出單元,被配置成將自然語言查詢語句輸入初始模型,得到實際結構化查詢語句;判斷單元,被配置成判斷實際結構化查詢語句是否滿足預設的匹配條件,確定實際結構化查詢語句與自然語言查詢語句對應的目標結構化查詢語句的匹配值;生成單元,被配置成基于匹配值,更新初始模型的網絡參數,生成語言轉換模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于百度在線網絡技術(北京)有限公司,未經百度在線網絡技術(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911335116.X/2.html,轉載請聲明來源鉆瓜專利網。





