[發明專利]用于輸出結構化查詢語句的方法和裝置有效
| 申請號: | 201911412056.7 | 申請日: | 2019-12-31 |
| 公開(公告)號: | CN111159220B | 公開(公告)日: | 2023-06-23 |
| 發明(設計)人: | 王麗杰;楊春杰;孫珂;李婷婷 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06F16/242 | 分類號: | G06F16/242;G06F16/2452;G06N3/0455;G06N3/0442;G06N3/084 |
| 代理公司: | 北京英賽嘉華知識產權代理有限責任公司 11204 | 代理人: | 王達佐;馬曉亞 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 輸出 結構 查詢 語句 方法 裝置 | ||
本申請實施例公開了用于輸出結構化查詢語句的方法和裝置。該方法的一具體實施方式包括:獲取待轉換的自然語言語句;將自然語言語句輸入至預先訓練的第一模型,生成自然語言語句對應的模板化自然語言;根據預先設置的模板化自然語言與結構化查詢語句的對應關系,輸出所生成的模板化自然語言對應的結構化查詢語句。該實施方式提高了輸出結構化查詢語句的準確度。
技術領域
本申請實施例涉及計算機技術領域,尤其涉及用于輸出結構化查詢語句的方法和裝置。
背景技術
信息時代,數據庫作為信息的載體,得到了越來越廣泛的應用。人們需要從數據庫中查詢各種數據,需要掌握標準的結構化查詢語言(Structured?Query?Language,SQL)。但是對于許多非專業人員來說,掌握SQL比較困難,需要學習SQL的各種語法,所以急切需要一種將自然語言轉換為結構化查詢語句的方法以供非專業人員使用數據庫。
現有的生成結構化查詢語句的方法通常是人工編寫結構化查詢語句或將自然語言查詢語句輸入預先訓練的機器學習模型,得到模型輸出的結構化查詢語句。
發明內容
本申請實施例提出了用于輸出結構化查詢語句的方法和裝置。
第一方面,本申請的一些實施例提供了一種用于輸出結構化查詢語句的方法,該方法包括:獲取待轉換的自然語言語句;將自然語言語句輸入至預先訓練的第一模型,生成自然語言語句對應的模板化自然語言;根據預先設置的模板化自然語言與結構化查詢語句的對應關系,輸出所生成的模板化自然語言對應的結構化查詢語句。
在一些實施例中,第一模型包括通過以下步驟訓練得到的模型:獲取樣本集,樣本集中包括樣本自然語言語句以及與樣本自然語言語句對應的樣本模板化自然語言;基于樣本集聯合訓練第一模型和第二模型,第二模型用于表征模板化自然語言與自然語言語句的對應關系。
在一些實施例中,基于樣本集聯合訓練第一模型和第二模型,包括:將樣本自然語言語句與樣本自然語言語句對應的樣本模板化自然語言,分別作為輸入與輸出,基于預先建立的損失函數訓練得到第一模型,其中,損失函數包括為了滿足第一模型和第二模型的概率對偶性而增加的正則項。
在一些實施例中,樣本集中包括經由以下步驟生成的樣本模板化自然語言:基于待輸出的結構化查詢語句關聯的數據庫獲取關鍵信息,關鍵信息包括以下至少一項:表名、字段名、屬性、結構化查詢語言中操作符和運算符;將所獲取的關鍵信息填入預先定義的自然語言模板得到樣本模板化自然語言。
在一些實施例中,根據預先設置的模板化自然語言與結構化查詢語句的對應關系,輸出所生成的模板化自然語言對應的結構化查詢語句,包括:確定所生成的模板化自然語言包括的關鍵信息以及對應的自然語言模板;根據預先建立的自然語言模板與結構化查詢語句模板的對應關系,獲取所確定的自然語言模板對應的結構化查詢語句模板;將確定出的關鍵信息填入所獲取的結構化查詢語句模板中,得到結構化查詢語句。
第二方面,本申請的一些實施例提供了一種用于輸出結構化查詢語句的裝置,該裝置包括:獲取單元,被配置成獲取待轉換的自然語言語句;生成單元,被配置成將自然語言語句輸入至預先訓練的第一模型,生成自然語言語句對應的模板化自然語言;輸出單元,被配置成根據預先設置的模板化自然語言與結構化查詢語句的對應關系,輸出所生成的模板化自然語言對應的結構化查詢語句。
在一些實施例中,裝置還包括訓練單元,訓練單元,包括:第一獲取子單元,被配置成獲取樣本集,樣本集中包括樣本自然語言語句以及與樣本自然語言語句對應的樣本模板化自然語言;訓練子單元,被配置成基于樣本集聯合訓練第一模型和第二模型,第二模型用于表征模板化自然語言與自然語言語句的對應關系。
在一些實施例中,訓練子單元,進一步被配置成:將樣本自然語言語句與樣本自然語言語句對應的樣本模板化自然語言,分別作為輸入與輸出,基于預先建立的損失函數訓練得到第一模型,其中,損失函數包括為了滿足第一模型和第二模型的概率對偶性而增加的正則項。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911412056.7/2.html,轉載請聲明來源鉆瓜專利網。





