[發明專利]一種搜索方法、裝置、終端設備及存儲介質在審
| 申請號: | 202010322885.2 | 申請日: | 2020-04-22 |
| 公開(公告)號: | CN113535710A | 公開(公告)日: | 2021-10-22 |
| 發明(設計)人: | 陳浩宇;農革 | 申請(專利權)人: | 中山大學 |
| 主分類號: | G06F16/22 | 分類號: | G06F16/22;G06F16/23;G06F16/248 |
| 代理公司: | 深圳中一聯合知識產權代理有限公司 44414 | 代理人: | 任敏 |
| 地址: | 510275 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 搜索 方法 裝置 終端設備 存儲 介質 | ||
本申請適用于信息技術領域,提供了一種搜索方法、裝置、終端設備及存儲介質,所述方法包括:當接收到待搜索信息時,識別所述待搜索信息的搜索類型;若所述搜索類型為二進制搜索,則根據所述待搜索信息生成多個子搜索信息;分別采用所述多個子搜索信息進行搜索,獲得與每個子搜索信息相匹配的搜索結果;輸出所述搜索結果。通過上述方法,可以實現高效且準確的二進制搜索。
技術領域
本申請屬于信息技術領域,特別是涉及一種搜索方法、裝置、終端設備及存儲介質。
背景技術
現代計算機系統通常以二進制位存儲數據,并存在多種數據表示形式,如十進制、十六進制、單字節和多字節等。一般情況下,對于數據的輸入輸出采用字節或字符為單位,不直接以二進制位方式進行處理。在數據搜索領域也是如此,主流搜索引擎的搜索模式通常以字節或字符為單位,不支持二進制位搜索。然而,在部分場景下,二進制搜索依然存在迫切的需求。雖然部分專用系統實現了二進制搜索的功能,但往往采取遍歷方式獲取結果,搜索效率不佳。
數據索引是提升數據搜索效率的有效手段。在數據索引領域,后綴索引無需對數據分詞,可對任意類型數據無差別地創建索引,并實現100%的查全率。后綴索引通常以字節為單位,一般只支持以字節為單位的搜索模式,無法實現二進制搜索。因此,如何結合數據索引技術實現高效且準確的二進制搜索,是目前有待解決的一個問題。
發明內容
有鑒于此,本申請實施例提供了一種搜索方法、裝置、終端設備及存儲介質,可以實現高效且準確的二進制搜索。
本申請實施例的第一方面提供了一種搜索方法,包括:
當接收到待搜索信息時,識別所述待搜索信息的搜索類型;
若所述搜索類型為二進制搜索,則根據所述待搜索信息生成多個子搜索信息;
分別采用所述多個子搜索信息進行搜索,獲得與每個子搜索信息相匹配的搜索結果;
輸出所述搜索結果。
本申請實施例的第二方面提供了一種搜索裝置,包括:
搜索類型識別模塊,用于在接收到待搜索信息時,識別所述待搜索信息的搜索類型;
子搜索信息生成模塊,用于若所述搜索類型為二進制搜索,則根據所述待搜索信息生成多個子搜索信息;
子搜索信息搜索模塊,用于分別采用所述多個子搜索信息進行搜索,獲得與每個子搜索信息相匹配的搜索結果;
搜索結果輸出模塊,用于輸出所述搜索結果。
本申請實施例的第三方面提供了一種終端設備,包括存儲器、處理器以及存儲在所述存儲器中并可在所述處理器上運行的計算機程序,所述處理器執行所述計算機程序時實現如上述第一方面所述的搜索方法。
本申請實施例的第四方面提供了一種計算機可讀存儲介質,所述計算機可讀存儲介質存儲有計算機程序,所述計算機程序被處理器執行時實現如上述第一方面所述的搜索方法。
本申請實施例的第五方面提供了一種計算機程序產品,當所述計算機程序產品在終端設備上運行時,使得所述終端設備執行上述第一方面所述的搜索方法。
與現有技術相比,本申請實施例包括以下優點:
本申請實施例,當接收到待搜索信息時,通過識別待搜索信息的搜索類型,從而可以根據不同的搜索類型分別進行搜索或處理。具體地,若搜索類型為二進制搜索,則可以根據待搜索信息生成多個子搜索信息,將待搜索信息擴展為字節模式,再分別采用字節模式的多個子搜索信息進行搜索,獲得與每個子搜索信息相匹配的搜索結果;而對于搜索類型為字節搜索的待搜索信息,則可以直接按照字節搜索的方式進行搜索。本實施例通過采用模式擴展和后綴索引技術,可以解決對任意類型數據的二進制搜索問題,有效地提升了二進制搜索的效率和性能。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中山大學,未經中山大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010322885.2/2.html,轉載請聲明來源鉆瓜專利網。





