[發明專利]基于自然語言的數據查詢方法、裝置及翻譯模型在審
| 申請號: | 202011215342.7 | 申請日: | 2020-11-04 |
| 公開(公告)號: | CN112182022A | 公開(公告)日: | 2021-01-05 |
| 發明(設計)人: | 劉煜 | 申請(專利權)人: | 北京安博通科技股份有限公司 |
| 主分類號: | G06F16/242 | 分類號: | G06F16/242;G06F16/2452;G06F16/2453;G06F16/2455 |
| 代理公司: | 北京弘權知識產權代理事務所(普通合伙) 11363 | 代理人: | 郭放;許偉群 |
| 地址: | 100120 北京市西城*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 自然語言 數據 查詢 方法 裝置 翻譯 模型 | ||
本申請實施例公開了基于自然語言的數據查詢方法、裝置及翻譯模型,該方法包括將用戶輸入的自然語言查詢語句,輸入至預先構建的翻譯模型中,通過該翻譯模型從自然語言查詢語句中提取出擬查詢字段及擬條件字段,并從預設的表字段中篩選出與擬查詢字段距離最近的字段作為最終查詢字段,以及從表字段中篩選出與擬條件字段距離最近的字段作為最終條件字段,將最終查詢字段及最終條件字段拼接成SQL查詢語句;根據翻譯模型輸出的SQL查詢語句進行數據查詢。上述方法通過提取擬查詢字段及擬條件字段,識別出自然語言查詢語句與翻譯模型中預存的語言存在差異的字段,并對這些字段進行修正以進行后續的數據查詢,能夠有效防止出現無法查詢的現象。
技術領域
本申請涉及數據查詢技術領域,尤其涉及基于自然語言的數據查詢方法、裝置及翻譯模型。
背景技術
結構化查詢語言(Structured Query Language,SQL)是一種用于存取數據以及查詢、更新和管理關系數據庫系統的編程語言。技術用戶可以通過SQL與數據庫中存儲的結構化數據進行交互,實現數據的查詢。
但是,SQL是一種專業性較強的編程語言,其使用難度限制了非技術用戶。為了使非技術用戶能夠通過自然語言便可與結構化數據進行交互,目前已普遍采用神經網絡模型實現自然語言與SQL語句之間的翻譯。數據查詢過程中,用戶只需輸入自然語言查詢語句,神經網絡模型在對接收到自然語言查詢語句時,對其進行翻譯,獲取SQL語句,然后通過該SQL語句從數據庫中查詢相應的結構化數據反饋給用戶。其中所采用的神經網絡模型為包含自然語言與SQL語句之間映射關系的翻譯模型。
但是實際應用中,用戶在輸入自然語言查詢語句時,其措辭有很大可能性會與翻譯模型中預設的自然語言語句之間存在不一樣的地方,例如,若用戶輸入的是“來源端口等于80的攻擊類型有哪些”,但是翻譯模型中預存的語言為“源端口等于80的攻擊類型有哪些”,雖然這兩種表達方式屬于一種語義,但是翻譯模型卻無法識別出用戶究竟想查詢什么內容,將無法將其轉換為SQL語句,造成無法查詢的后果。
發明內容
為了解決用于在輸入自然語言查詢語句時,其措辭有很大可能性會與翻譯模型中預設的自然語言語句之間存在不一樣的地方,導致翻譯模型卻無法識別出用戶究竟想查詢什么內容,將無法將其轉換為SQL語句,造成無法查詢的問題,本申請通過以下實施例公開了基于自然語言的數據查詢方法、裝置及翻譯模型。
本申請第一方面公開了一種基于自然語言的數據查詢方法,所述數據查詢方法包括:
獲取用戶輸入的自然語言查詢語句;
將所述自然語言查詢語句輸入至預先構建的翻譯模型中,所述翻譯模型用于從所述自然語言查詢語句中提取出擬查詢字段及擬條件字段,并從預設的表字段中篩選出與所述擬查詢字段距離最近的字段作為最終查詢字段,以及從所述表字段中篩選出與所述擬條件字段距離最近的字段作為最終條件字段,最后將所述最終查詢字段及所述最終條件字段拼接成SQL查詢語句,其中,所述擬查詢字段及所述擬條件字段均不屬于所述表字段中的任意字段;
根據所述翻譯模型輸出的SQL查詢語句進行數據查詢。
可選的,所述翻譯模型用于通過以下操作,從所述自然語言查詢語句中提取出擬查詢字段及擬條件字段:
對所述自然語言查詢語句中每個字段進行向量編碼,獲取對應的字段向量序列;
對所述字段向量序列中的每個字段向量進行類型標注,其中,所述類型標注包括有效標注和無效標注,所述有效標注包括條件標注、操作符標注、條件值標注及查詢字段標注;
將所述查詢字段標注對應的字段設為所述擬查詢字段,將所述條件標注對應的字段設為所述擬條件字段。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京安博通科技股份有限公司,未經北京安博通科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011215342.7/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種多級滅病毒組合系統
- 下一篇:一種多功能分離式插線排
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





