[發明專利]基于語義規則和多維模型的多數據源NL2SQL系統有效
| 申請號: | 202011184962.9 | 申請日: | 2020-10-30 |
| 公開(公告)號: | CN112559550B | 公開(公告)日: | 2021-09-07 |
| 發明(設計)人: | 李智;錢泓錦;劉占亮 | 申請(專利權)人: | 北京智源人工智能研究院 |
| 主分類號: | G06F16/242 | 分類號: | G06F16/242;G06F16/22;G06F16/2455;G06F40/242;G06F40/289;G06F40/295;G06F40/30 |
| 代理公司: | 北京動力號知識產權代理有限公司 11775 | 代理人: | 梁艷;白婉露 |
| 地址: | 100083 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 語義 規則 多維 模型 多數 nl2sql 系統 | ||
本發明公開了一種基于語義規則和多維模型的多數據源NL2SQL系統,包括用于實現NL2SQL的業務層,所述業務層包括:配置模塊,用于配置匹配規則;數據模型構建模塊,用于構建可利用數據庫的表和字段信息生成SQL語句的數據模型;意圖識別模塊,用于根據所述匹配規則將自然語句解析、匹配得到數據庫的表和字段信息,并利用所述數據模型生成可執行的SQL語句。該系統不依賴標注語料和模型,通過界面簡單的配置就可以實現基于意圖的NL2SQL;通過數據模型構建模塊支持多選擇嵌套,可以靈活配置;通過意圖識別模塊降低對數據集的要求,提升SQL生成的成功率。所以,采用本發明提供的系統,能根據不同的項目快速構建業務場景。
技術領域
本發明涉及智能搜索技術領域,尤其涉及一種基于語義規則和多維模型的多數據源NL2SQL系統。
背景技術
智能化搜索中,計算機理解用戶查詢意圖的過程成為了業界研究的熱點,而在理解用戶意圖之前,首先需要把自然語言轉化為計算機可以理解并生成準確表達語句語義的可執行程序式語言。Natural Language to SQL(NL2SQL)是將用戶的自然語言語句轉換成計算機可讀懂、可運行、符合計算機規則語義表示的一種方法。
目前,NL2SQL技術中,需要專業的知識儲備進行詞典配置,對nlp和模型訓練有一定的要求;另外,其對數據集的要求比較高,需要大量標注好的訓練集語料和測試集語料和拒識數據(一些自然語言沒有對應的SQL語句,模型應該拒絕作出預測)來進行模型訓練,環節流程復雜且完成時間長。
所以,現有的NL2SQL技術在實際使用過程中很難推廣應用。
發明內容
為了解決現有技術中存在的技術問題,本發明提供了如下技術方案。
本發明提供了一種基于語義規則和多維模型的多數據源NL2SQL系統,包括用于實現NL2SQL的業務層,所述業務層包括:
配置模塊,用于配置匹配規則;
數據模型構建模塊,用于構建可利用數據庫的表和字段信息生成SQL語句的數據模型;
意圖識別模塊,用于根據所述匹配規則將輸入的自然語句解析、匹配得到數據庫的表和字段信息,并利用所述數據模型生成可執行的SQL語句。
優選地,所述配置模塊包括:
語境配置模塊,用于配置語境匹配規則;
用戶詞典配置模塊,用于配置用戶詞典;
表字段配置模塊,用于配置數據庫的表、字段、表關系、表和字段關系;
語義片段配置模塊,用于配置語義片段匹配規則。
優選地,所述用戶詞典配置模塊包括用戶自定義模塊和專業詞典模塊,所述用戶自定義模塊用于配置用戶自定義的同義詞、停用詞、關鍵詞和/或實體,所述專業詞典模塊用于配置專業詞典。
優選地,所述用戶詞典配置模塊還包括第三方分詞和實體識別模型調用模塊,用于配置第三方分詞和實體識別模型的調用接口。
優選地,所述語義片段匹配規則包括匹配詞語、語義規則和要素字段。
優選地,所述意圖識別模塊包括:
語境匹配模塊,用于根據配置的語境匹配規則,將所述自然語句進行語境匹配,得到所述自然語句的語境信息;
標簽識別模塊,用于根據配置的用戶詞典,結合所述語境信息,對所述自然語句進行分詞和實體識別,得到分詞對應的實體類型;
語義片段匹配模塊,用于根據配置的語義片段匹配規則進行分詞匹配,得到語義片段;
數據庫字段關聯模塊,用于利用所述語義片段匹配配置的數據庫的表和字段,得到對應的表和字段信息以及表關系;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京智源人工智能研究院,未經北京智源人工智能研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011184962.9/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:自動扶梯及其梯級間隙監測預警方法
- 下一篇:一種用于框架類工件的批量檢測裝置





