[發(fā)明專利]一種信息搜索方法、裝置及設(shè)備在審
| 申請(qǐng)?zhí)枺?/td> | 202111241094.8 | 申請(qǐng)日: | 2021-10-25 |
| 公開(公告)號(hào): | CN113918684A | 公開(公告)日: | 2022-01-11 |
| 發(fā)明(設(shè)計(jì))人: | 孫玲;李琳 | 申請(qǐng)(專利權(quán))人: | 咪咕文化科技有限公司;中國(guó)移動(dòng)通信集團(tuán)有限公司 |
| 主分類號(hào): | G06F16/33 | 分類號(hào): | G06F16/33;G06F16/335;G06F16/383 |
| 代理公司: | 北京市浩天知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11276 | 代理人: | 梁倩 |
| 地址: | 100032 北京市西城區(qū)德*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 信息 搜索 方法 裝置 設(shè)備 | ||
本發(fā)明公開了一種信息搜索方法、裝置及設(shè)備,該方法包括:獲取用于搜索文檔的目標(biāo)關(guān)鍵詞;將所述目標(biāo)關(guān)鍵詞包含的關(guān)鍵字輸入布隆過濾器,以從文檔集合中,篩選與所述關(guān)鍵字的布隆索引相對(duì)應(yīng)的第一文檔集合;基于所述目標(biāo)關(guān)鍵詞,對(duì)所述第一文檔集合進(jìn)行搜索,以得到包含所述目標(biāo)關(guān)鍵詞的第二文檔集合。通過上述方式,本發(fā)明的方案可以有效提升搜索速度,縮短搜索時(shí)長(zhǎng)。
技術(shù)領(lǐng)域
本發(fā)明涉及信息搜索技術(shù)領(lǐng)域,具體涉及一種信息搜索方法、裝置及設(shè)備。
背景技術(shù)
現(xiàn)有中文搜索技術(shù)無論是倒排索引等正向索引方式還是其他的搜索方案,都是根據(jù)索引全量掃描文檔或者是建立了索引后,先掃描索引,再掃描文檔,從而獲得包含搜索關(guān)鍵字的文檔信息。當(dāng)文檔數(shù)量巨大,通過全文掃描方式或者正向索引方式進(jìn)行搜索耗時(shí)長(zhǎng)、效率低。
發(fā)明內(nèi)容
鑒于上述問題,提出了本發(fā)明實(shí)施例以便提供一種克服上述問題或者至少部分地解決上述問題的信息搜索方法、裝置及設(shè)備。
根據(jù)本發(fā)明實(shí)施例的一個(gè)方面,提供了一種信息搜索方法,所述方法包括:
獲取用于搜索文檔的目標(biāo)關(guān)鍵詞;
將所述目標(biāo)關(guān)鍵詞包含的關(guān)鍵字輸入布隆過濾器,以從文檔集合中,篩選與所述關(guān)鍵字的布隆索引相對(duì)應(yīng)的第一文檔集合;
基于所述目標(biāo)關(guān)鍵詞,對(duì)所述第一文檔集合進(jìn)行搜索,以得到包含所述目標(biāo)關(guān)鍵詞的第二文檔集合。
根據(jù)本發(fā)明實(shí)施例的另一方面,提供了一種信息搜索裝置,所述裝置包括:
獲取模塊,用于獲取用于搜索文檔的目標(biāo)關(guān)鍵詞;
處理模塊,用于將所述目標(biāo)關(guān)鍵詞包含的關(guān)鍵字輸入布隆過濾器,以從文檔集合中,篩選與所述關(guān)鍵字的布隆索引相對(duì)應(yīng)的第一文檔集合;基于所述目標(biāo)關(guān)鍵詞,對(duì)所述第一文檔集合進(jìn)行搜索,以得到包含所述目標(biāo)關(guān)鍵詞的第二文檔集合。
根據(jù)本發(fā)明實(shí)施例的又一方面,提供了一種計(jì)算設(shè)備,包括:處理器、存儲(chǔ)器、通信接口和通信總線,所述處理器、所述存儲(chǔ)器和所述通信接口通過所述通信總線完成相互間的通信;
所述存儲(chǔ)器用于存放至少一可執(zhí)行指令,所述可執(zhí)行指令使所述處理器執(zhí)行上述信息搜索方法對(duì)應(yīng)的操作。
根據(jù)本發(fā)明實(shí)施例的再一方面,提供了一種計(jì)算機(jī)存儲(chǔ)介質(zhì),所述存儲(chǔ)介質(zhì)中存儲(chǔ)有至少一可執(zhí)行指令,所述可執(zhí)行指令使處理器執(zhí)行如上述的信息搜索方法對(duì)應(yīng)的操作。
根據(jù)本發(fā)明上述實(shí)施例提供的方案,信息搜索方法通過獲取用于搜索文檔的目標(biāo)關(guān)鍵詞;將所述目標(biāo)關(guān)鍵詞包含的關(guān)鍵字輸入布隆過濾器,以從文檔集合中,篩選與所述關(guān)鍵字的布隆索引相對(duì)應(yīng)的第一文檔集合;基于所述目標(biāo)關(guān)鍵詞,對(duì)所述第一文檔集合進(jìn)行搜索,以得到包含所述目標(biāo)關(guān)鍵詞的第二文檔集合,有效提升了搜索速度,整體上大大縮短搜索時(shí)長(zhǎng),由此解決了現(xiàn)有技術(shù)中搜索耗時(shí)長(zhǎng)、效率低的問題,取得了有效提升搜索速度,整體上大大縮短搜索時(shí)長(zhǎng)的有益效果。
上述說明僅是本發(fā)明實(shí)施例技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明實(shí)施例的技術(shù)手段,而可依照說明書的內(nèi)容予以實(shí)施,并且為了讓本發(fā)明實(shí)施例的上述和其它目的、特征和優(yōu)點(diǎn)能夠更明顯易懂,以下特舉本發(fā)明實(shí)施例的具體實(shí)施方式。
附圖說明
通過閱讀下文優(yōu)選實(shí)施方式的詳細(xì)描述,各種其他的優(yōu)點(diǎn)和益處對(duì)于本領(lǐng)域普通技術(shù)人員將變得清楚明了。附圖僅用于示出優(yōu)選實(shí)施方式的目的,而并不認(rèn)為是對(duì)本發(fā)明實(shí)施例的限制。而且在整個(gè)附圖中,用相同的參考符號(hào)表示相同的部件。在附圖中:
圖1示出了本發(fā)明實(shí)施例提供的信息搜索方法流程圖;
圖2示出了本發(fā)明實(shí)施例提供的信息搜索方法中布隆過濾器的優(yōu)化過程的流程圖;
圖3示出了本發(fā)明的實(shí)施例提供的信息搜索方法的一具體實(shí)現(xiàn)流程示意圖;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于咪咕文化科技有限公司;中國(guó)移動(dòng)通信集團(tuán)有限公司,未經(jīng)咪咕文化科技有限公司;中國(guó)移動(dòng)通信集團(tuán)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111241094.8/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 信息記錄介質(zhì)、信息記錄方法、信息記錄設(shè)備、信息再現(xiàn)方法和信息再現(xiàn)設(shè)備
- 信息記錄裝置、信息記錄方法、信息記錄介質(zhì)、信息復(fù)制裝置和信息復(fù)制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄設(shè)備、信息重放設(shè)備、信息記錄方法、信息重放方法、以及信息記錄介質(zhì)
- 信息存儲(chǔ)介質(zhì)、信息記錄方法、信息重放方法、信息記錄設(shè)備、以及信息重放設(shè)備
- 信息存儲(chǔ)介質(zhì)、信息記錄方法、信息回放方法、信息記錄設(shè)備和信息回放設(shè)備
- 信息記錄介質(zhì)、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置
- 一種數(shù)據(jù)庫讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





