[發明專利]一種通過自然語言實現結構化數據搜索的方法有效
| 申請號: | 201711015609.6 | 申請日: | 2017-10-26 |
| 公開(公告)號: | CN107748784B | 公開(公告)日: | 2021-05-25 |
| 發明(設計)人: | 邢加和 | 申請(專利權)人: | 江蘇賽睿信息科技股份有限公司 |
| 主分類號: | G06F16/242 | 分類號: | G06F16/242 |
| 代理公司: | 北京冠和權律師事務所 11399 | 代理人: | 朱健;陳國軍 |
| 地址: | 211100 江蘇省南京市雨*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 通過 自然語言 實現 結構 數據 搜索 方法 | ||
1.一種通過自然語言實現結構化數據搜索的方法,通過自然語言輸入模塊、語言解析模塊、數據處理模塊、輸出模塊實現,其特征在于,包括:
自然語言輸入模塊接收用戶輸入的自然語言,所述自然語言為文字或語音;
語言解析模塊用于對所述自然語言進行解析,并將語言解析結果發送給數據處理模塊;
數據處理模塊根據接收到的語言解析結果對待檢索數據進行操作,并將操作結果發送至輸出模塊,所述操作包括查詢操作;
輸出模塊將接收到的輸出結果進行輸出;
所述語言解析結果,包括關鍵字和每個關鍵字所對應的解析準確性權值;
所述數據處理模塊根據接收到的語言解析結果對待檢索數據進行操作,并將操作結果發送至輸出模塊,可實施為:
數據處理模塊接收到的語言解析結果,包括關鍵字和每個關鍵字所對應的解析準確性權值;
數據處理模塊根據預設規則對所述關鍵字進行分類,得到不同類別的關鍵字,包括過濾條件關鍵字、輸出列關鍵字、結果展現方式關鍵字;
數據處理模塊通過關鍵字按其類別對待檢索的結構化數據進行檢索;
數據處理模塊根據每個檢索結果所用到的關鍵字進行排序,得到排序后的檢索結果,所述排序方法為根據所用到的關鍵字的解析準確性權值之和由大到小進行排序;
數據處理模塊在排序后的檢索結果中從前向后選取預設數量的檢索結果,并將其設置為操作結果;
數據處理模塊將操作結果發送至輸出模塊;
所述語言解析模塊,還用于:
對解析得到的關鍵字進行擴展,得到擴展后的關鍵字,所述擴展為根據預設的規則通過關鍵字獲取潛在關鍵字,所述潛在關鍵字為根據預設規則獲取的、與關鍵字的讀音或形狀相近的關鍵字;
根據預設的規則對擴展后的關鍵字賦予解析準確性權值,所述權值小于1;
所述潛在關鍵字,還包括:
與關鍵字的輸入按鍵序列相似度在預設范圍內的字或詞,所述字或詞在預設的詞典中查找,所述輸入按鍵序列相似度由第一公式計算,所述第一公式為:
其中,S表示相似度;n為關鍵字的輸入按鍵的次數;ai表示關鍵字的第i次按鍵;bi表示字或詞的第i次按鍵;d(ai,bi)為字或詞的第i次按鍵與關鍵字的第i次按鍵在鍵盤上的距離的函數,d(ak+1,bk+2)表示為字或詞的第k+1次按鍵與關鍵詞的第k+2次按鍵在鍵盤上的距離的函數,d(ak+2,bk+1)表示為字或詞的第k+2次按鍵與關鍵詞的第k+1次按鍵在鍵盤上的距離的函數,當所述距離增加時,其值降低,其最小值為0,當所述距離為0時,該函數值為1;q為可調整參數,其值大于0且小于1,表示字或詞調整2個按鍵的輸入順序即變成關鍵字的可能性權重;k為大于等于i且小于等于n的任一正整數。
2.如權利要求1所述的方法,其特征在于,所述查詢操作,對待檢索的結構化數據執行查詢操作,所述查詢操作實施為先根據輸入的自然語言中過濾條件篩選出相應的行,再根據輸入的自然語言中需要的內容查詢出相應的列。
3.如權利要求1所述的方法,其特征在于,
所述自然語言輸入模塊,包括顯示設備顯示的輸入框,用于輸入自然語言;
所述輸出模塊,包括顯示設備顯示的輸出界面,用于以數字、圖表、圖形中任一種,或數字、圖表、圖形的組合的方式顯示輸出結果;所述輸出界面與所述輸入框在顯示設備顯示的同一界面顯示。
4.如權利要求1所述的方法,其特征在于,所述語言解析模塊用于對所述自然語言進行解析,包括:
語言解析模塊對所述自然語言進行分詞,得到分詞結果;
語言解析模塊對所述分詞結果進行詞性標注,得到標注結果;
語言解析模塊對所述標注結果進行命名實體識別,得到實體識別結果;
語言解析模塊依據預設的規則對所述命名實體識別結果賦予權值,得到帶有權值的實體識別結果;
語言解析模塊根據預設的規則選擇帶有權值的實體識別結果,將其設置為關鍵字,將其權值設置為和關鍵字對應的解析準確性權值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于江蘇賽睿信息科技股份有限公司,未經江蘇賽睿信息科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711015609.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種基于句向量的多標簽公司描述文本分類方法
- 下一篇:衣櫥管理方法及移動終端





