[發明專利]結構化查詢語句生成系統及方法有效
| 申請號: | 201510054595.3 | 申請日: | 2015-01-30 |
| 公開(公告)號: | CN104657440B | 公開(公告)日: | 2020-05-15 |
| 發明(設計)人: | 歐陽江 | 申請(專利權)人: | 歐陽江 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/36 |
| 代理公司: | 深圳市隆天聯鼎知識產權代理有限公司 44232 | 代理人: | 萬振雄;劉耿 |
| 地址: | 510630 廣東省*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 結構 查詢 語句 生成 系統 方法 | ||
一種結構化查詢語句生成方法,包括:獲取自然語言查詢語句;利用預設的詞典及第一規則,對所述自然語言查詢語句進行切詞,并得到切詞方案;利用預設的第二規則,在所述切詞方案上生成解析樹;根據所述解析樹的根節點生成局部查詢參數,及代入所述解析樹第一層子節點的全局查詢參數并得到所述解析樹的根節點的全局查詢參數;及根據所述解析樹的根節點的全局查詢參數生成結構化查詢語句。本發明還提供一種結構化查詢語句生成系統。利用本發明可自動將自然語言查詢語句轉換成結構化查詢語句。
技術領域
本發明涉及檢索技術,尤其涉及一種結構化查詢語句生成系統及方法。
背景技術
隨著互聯網技術的發展,用戶對精準查詢的要求越來越高。傳統的搜索引擎只能機械地對用戶輸入的查詢語句進行切詞處理,并不能真正理解用戶的意圖和要求,返回的查詢結果偏差很大,在應用至手機上時尤其影響用戶體驗。并且,無論是企業還是網站,有大量數據是存放在關系數據庫中的,這些數據通常不會直接在網頁上發布,所以不能為搜索引擎所訪問,因此,這些數據也根本不會在查詢結果中出現。
此外,在大數據時代,也面臨著人機交互問題:在眾多數據源的背景下,如何為用戶提供一種簡潔的查詢手段而不是復雜的菜單系統;在大數據背景下,對數據進行各種統計、挖掘分析的結果,如何能被用戶很容易地訪問到。
因此,允許用戶直接使用自然語言提出檢索要求,由計算機系統在理解用戶輸入的基礎上,自動完成有關檢索,返回符合用戶要求的精準的檢索結果,是一個對數據檢索進行優化的解決方案。
目前,實現上述解決方案的過程是,獲取用戶輸入的自然語言查詢語句;根據用戶輸入的自然語言查詢語句生成結構化查詢語句,通過結構化查詢語句查詢或搜索得到與自然語言查詢語句對應的查詢結果。
目前常有的生成結構化查詢語句的方法是:獲取用戶輸入的自然語言查詢語句;將自然語言查詢語句與查詢模板進行四配,得到與自然語言查詢語句匹配的查詢模板;根據與自然語言查詢語句匹配的查詢模板,得到結構化查詢語句。
然而,如上文所述的生成結構化查詢語句的方法,需要事先由人工配置查詢模板,為每個查詢模板編寫結構化查詢語句,因此至少存在以下問題:1)人工配置查詢模板、編寫結構化查詢語句的代價非常高昂,且效率低下;2)不同的用戶可能會采用不同的表達方式來表達自然語言查詢語句,這樣會使查詢模板無法被正確匹配,影響匹配的準確性;3)當自然語言查詢語句是嵌套的問句時,查詢模板無法進行匹配,導致語義損失,無法滿足大規模工業化應用的要求。
發明內容
鑒于以上內容,有必要提供一種結構化查詢語句生成系統及方法,可根據用戶輸入的自然語言進行語義分析,繼而生成相應的結構化查詢語句,無需通過人工編制查詢模板,更無需進行模板匹配。
進一步地,還有必要提供一種結構化查詢語句生成系統及方法,可自動識別語義相同但表達形式不同的查詢語句,從而確保返回的檢索結果不受語言習慣的偏差的影響。
此外,還有必要提供一種結構化查詢語句生成系統及方法,可處理復雜嵌套的查詢,確保在不損失語義的條件下生成相應的復合查詢語句。
一種結構化查詢語句生成方法,應用于電子裝置,該方法包括:獲取自然語言查詢語句;利用預設的詞典及第一規則,對所述自然語言查詢語句進行切詞,并得到切詞方案;利用預設的第二規則,在所述切詞方案上生成解析樹;根據所述解析樹的根節點生成局部查詢參數,及代入所述解析樹第一層子節點的全局查詢參數并得到所述解析樹的根節點的全局查詢參數;及根據所述解析樹的根節點的全局查詢參數生成結構化查詢語句。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于歐陽江,未經歐陽江許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510054595.3/2.html,轉載請聲明來源鉆瓜專利網。





