[發明專利]一種自然語言至結構化查詢語言的轉換方法及系統有效
| 申請號: | 202010491307.1 | 申請日: | 2020-06-02 |
| 公開(公告)號: | CN111651474B | 公開(公告)日: | 2023-07-25 |
| 發明(設計)人: | 徐馳;羅明宇;林健 | 申請(專利權)人: | 東云睿連(武漢)計算技術有限公司 |
| 主分類號: | G06F16/242 | 分類號: | G06F16/242;G06F16/2452;G06F18/22 |
| 代理公司: | 武漢智正誠專利代理事務所(普通合伙) 42278 | 代理人: | 李衛 |
| 地址: | 430000 湖北省武漢市東湖新技術開發區金融*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 自然語言 結構 查詢 語言 轉換 方法 系統 | ||
本申請實施例公開了一種自然語言至結構化查詢語言的轉換方法及系統,該方法包括:獲取用戶輸入的自然語言問題文本;根據所述輸入的自然語言問題文本與預設數據集中自然語言問題的相似度,確定將所述輸入的自然語言問題文本轉換為結構化查詢語言的轉換結果;若所述預設數據集中不存在目標自然語言問題,則通過轉換算法模型將所述輸入的自然語言問題文本轉換為結構化查詢語言。采用本申請實施例,能夠降低結構化數據庫的訪問門檻,方便非技術人員直接查詢使用結構化數據庫。
技術領域
本申請涉及數據處理技術領域,尤其涉及一種自然語言至結構化查詢語言的轉換方法及系統。
背景技術
近年來深度學習行業發展迅速,深度學習技術不僅在計算機視覺、語音識別、自動駕駛等領域取得了令人矚目的進步,而且在自然語言處理(Natural?LanguageProcessing,NLP)領域也有長足的發展。深度學習中的神經網絡模型在自然語言處理領域中諸如命名實體識別、詞性標注、情感分析、閱讀理解、機器翻譯等任務中的表現已經全面超越了傳統方法。
在信息技術高速發展的今天,每天都會產生大量的數據,并保存在各式各樣的數據庫中。通常,查詢數據庫中的數據需要通過結構化查詢語言(SQL)這樣的程序式查詢語言來進行交互。但是對于許多非專業人員來說,掌握SQL語言存在一定的技術門檻。為了讓非專業用戶也能按需查詢數據庫,如何通過自然語言查詢數據庫中的目標數據成為了新興的研究熱點。
現有的類似工作大多是基于傳統的語言規則或模板匹配的方式,算法的泛化性和靈活性有一定的局限。
發明內容
本申請實施例公開了一種自然語言至結構化查詢語言的轉換方法及系統,能降低結構化數據庫的訪問門檻,方便非技術人員直接查詢使用結構化數據庫。
第一方面,本申請實施例提供了一種自然語言至結構化查詢語言的轉換方法,該方法包括:
獲取用戶輸入的自然語言問題文本;
根據所述輸入的自然語言問題文本與預設數據集中自然語言問題的相似度,確定將所述輸入的自然語言問題文本轉換為結構化查詢語言的轉換結果,其中,所述預設數據集中包含自然語言問題與對應的結構化查詢語言;
若所述預設數據集中不存在目標自然語言問題,則通過轉換算法模型將所述輸入的自然語言問題文本轉換為結構化查詢語言,其中,所述目標自然語言問題為所述預設數據集中與所述輸入的自然語言問題文本的相似度最高的一個自然語言問題,且所述輸入的自然語言問題文本與所述目標自然語言問題的相似度大于相似度閾值,所述轉換算法模型為基于深度學習算法模型進行模型訓練得到的。
在上述方法中,能夠降低結構化數據庫的訪問門檻,方便非技術人員直接查詢使用結構化數據庫,與傳統的基于語言規則或模板匹配的算法相比,基于深度學習的算法靈活性和泛化性更具優勢。
結合第一方面,在一種可能的實施方式中,所述根據所述輸入的自然語言問題文本與預設數據集中自然語言問題的相似度,確定將所述輸入的自然語言問題文本轉換為結構化查詢語言的轉換結果之后,還包括:
若所述預設數據集中存在所述目標自然語言問題,則將所述自然語言問題文本轉換為與所述目標自然語言問題對應的結構化查詢語言。
結合第一方面,在一種可能的實施方式中,所述根據所述輸入的自然語言問題文本與預設數據集中自然語言問題的相似度,確定將所述輸入的自然語言問題文本轉換為結構化查詢語言的轉換結果之前,還包括:
選擇預設場景下的數據庫作為樣本數據庫,其中,所述樣本數據庫中包含自然語言問題與對應的結構化查詢語言;
采集針對所述樣本數據庫中自然語言問題與對應的結構化查詢語言的數據集映射,作為所述預設數據集;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東云睿連(武漢)計算技術有限公司,未經東云睿連(武漢)計算技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010491307.1/2.html,轉載請聲明來源鉆瓜專利網。





