[發明專利]一種通過自然語言實現結構化數據搜索的方法有效
| 申請號: | 201711015609.6 | 申請日: | 2017-10-26 |
| 公開(公告)號: | CN107748784B | 公開(公告)日: | 2021-05-25 |
| 發明(設計)人: | 邢加和 | 申請(專利權)人: | 江蘇賽睿信息科技股份有限公司 |
| 主分類號: | G06F16/242 | 分類號: | G06F16/242 |
| 代理公司: | 北京冠和權律師事務所 11399 | 代理人: | 朱健;陳國軍 |
| 地址: | 211100 江蘇省南京市雨*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 通過 自然語言 實現 結構 數據 搜索 方法 | ||
本發明公開了一種通過自然語言實現結構化數據搜索的方法,通過自然語言輸入模塊、語言解析模塊、數據處理模塊、輸出模塊實現,包括:自然語言輸入模塊接收用戶輸入的自然語言,所述自然語言為文字或語音;語言解析模塊用于對所述自然語言進行解析,并將語言解析結果發送給數據處理模塊;數據處理模塊根據接收到的語言解析結果對待檢索數據進行操作,并將操作結果發送至輸出模塊;輸出模塊將接收到的輸出結果進行輸出。本發明提供的一種通過自然語言實現結構化數據搜索的方法,能夠通過自然語言實現對結構化數據的搜索,降低了數據檢索的技術門檻,提高了數據檢索的效率。
技術領域
本發明涉及信息檢索領域,特別涉及一種通過自然語言實現結構化數據搜索的方法。
背景技術
目前,在結構化數據的搜索當中,仍然以編寫SQL查詢語句為主,對數據庫的查詢等操作需要操作人員具有對應軟件方面的知識,熟悉數據庫軟件的操作,造成了數據庫查詢這種有較大需求的工作難以普及到個人,因此需要一種能夠讓不經過訓練就可以對數據庫進行查詢的方法,用以降低數據庫的使用門檻,提高數據庫的使用范圍。
發明內容
為解決以上問題,本發明提供一種通過自然語言實現結構化數據搜索的方法。
本發明提供的一種通過自然語言實現結構化數據搜索的方法,通過自然語言輸入模塊、語言解析模塊、數據處理模塊、輸出模塊實現,包括:
自然語言輸入模塊接收用戶輸入的自然語言,所述自然語言為文字或語音;
語言解析模塊用于對所述自然語言進行解析,并將語言解析結果發送給數據處理模塊;
數據處理模塊根據接收到的語言解析結果對待檢索數據進行操作,并將操作結果發送至輸出模塊,所述操作包括查詢操作;
輸出模塊將接收到的輸出結果進行輸出。
優選的,所述查詢操作,對待檢索的結構化數據執行查詢操作(結構化數據包括:文本文件、數據庫表等),所述查詢操作實施為先根據輸入的自然語言中過濾條件篩選出相應的行,再根據輸入的自然語言中需要的內容查詢出相應的列。
優選的,
所述自然語言輸入模塊,包括顯示設備顯示的輸入框,用于輸入自然語言;
所述輸出模塊,包括顯示設備顯示的輸出界面,用于以數字、圖表、圖形或數字、圖表、圖形的組合的方式顯示輸出結果;所述輸出界面與所述輸入框在顯示設備顯示的同一界面顯示。
優選的,所述語言解析結果,包括關鍵字和每個關鍵字所對應的解析準確性權值。
優選的,所述語言解析模塊用于對所述自然語言進行解析,包括:
語言解析模塊對所述自然語言進行分詞,得到分詞結果;
語言解析模塊對所述分詞結果進行詞性標注,得到標注結果;
語言解析模塊對所述標注結果進行命名實體識別,得到實體識別結果;
語言解析模塊依據預設的規則對所述命名實體識別結果賦予權值,得到帶有權值的實體識別結果;
語言解析模塊根據預設的規則選擇帶有權值的實體識別結果,將其設置為關鍵字,將其權值設置為和關鍵字對應的解析準確性權值。
優選的,所述語言解析模塊,還用于:
對解析得到的關鍵字進行擴展,得到擴展后的關鍵字,所述擴展為根據預設的規則通過關鍵字獲取潛在關鍵字,所述潛在關鍵字為根據預設規則獲取的、與關鍵字的讀音或形狀相近的關鍵字;
根據預設的規則對擴展后的關鍵字賦予解析準確性權值,所述權值小于1。
優選的,所述潛在關鍵字,還包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于江蘇賽睿信息科技股份有限公司,未經江蘇賽睿信息科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711015609.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種基于句向量的多標簽公司描述文本分類方法
- 下一篇:衣櫥管理方法及移動終端





