[發(fā)明專利]一種數(shù)據(jù)搜索方法和裝置有效
| 申請(qǐng)?zhí)枺?/td> | 201810040291.5 | 申請(qǐng)日: | 2018-01-16 |
| 公開(kāi)(公告)號(hào): | CN108256064B | 公開(kāi)(公告)日: | 2019-09-17 |
| 發(fā)明(設(shè)計(jì))人: | 朱敏;劉志成;張俊浩 | 申請(qǐng)(專利權(quán))人: | 北京三快在線科技有限公司 |
| 主分類號(hào): | G06F16/9535 | 分類號(hào): | G06F16/9535 |
| 代理公司: | 北京潤(rùn)澤恒知識(shí)產(chǎn)權(quán)代理有限公司 11319 | 代理人: | 莎日娜 |
| 地址: | 100000 北京市海*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 關(guān)鍵詞索引 文件描述信息 數(shù)據(jù)標(biāo)識(shí) 索引數(shù)據(jù) 索引文件 方法和裝置 搜索關(guān)鍵詞 頁(yè)高速緩沖 描述信息 數(shù)據(jù)搜索 加載 內(nèi)存 存儲(chǔ)器查詢 結(jié)果數(shù)據(jù) 映射關(guān)系 存儲(chǔ)器 申請(qǐng) | ||
本申請(qǐng)?zhí)峁┝艘环N數(shù)據(jù)搜索方法和裝置,包括:獲取描述索引文件的文件描述信息,所述文件描述信息包括關(guān)鍵詞索引的描述信息和索引數(shù)據(jù)的描述信息;所述關(guān)鍵詞索引表征關(guān)鍵詞與數(shù)據(jù)標(biāo)識(shí)之間的映射關(guān)系;根據(jù)所述文件描述信息,由所述索引文件中獲取所述關(guān)鍵詞索引并加載到頁(yè)高速緩沖存儲(chǔ)器中,由所述索引文件中獲取所述索引數(shù)據(jù)并加載到Java虛擬機(jī)內(nèi)存中;根據(jù)搜索關(guān)鍵詞由所述頁(yè)高速緩沖存儲(chǔ)器查詢所述關(guān)鍵詞索引,得到與所述搜索關(guān)鍵詞對(duì)應(yīng)的數(shù)據(jù)標(biāo)識(shí),根據(jù)所述數(shù)據(jù)標(biāo)識(shí)由所述Java虛擬機(jī)內(nèi)存中的所述索引數(shù)據(jù)獲得結(jié)果數(shù)據(jù)。
技術(shù)領(lǐng)域
本申請(qǐng)涉及搜索技術(shù)領(lǐng)域,具體而言,涉及一種數(shù)據(jù)搜索方法和裝置。
背景技術(shù)
隨著互聯(lián)網(wǎng)技術(shù)的興起,信息呈爆炸式增長(zhǎng),用戶希望能夠從海量的信息中獲取自己關(guān)注的內(nèi)容,由此而誕生了多種搜索引擎。搜索引擎發(fā)展伊始主要針對(duì)網(wǎng)頁(yè)搜索,而網(wǎng)頁(yè)也是傳統(tǒng)互聯(lián)網(wǎng)的主要信息載體。然而近年來(lái),隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,用于可以方便的通過(guò)移動(dòng)設(shè)備訪問(wèn)互聯(lián)網(wǎng),獲取服務(wù),由此而興起了一批線上-線下(Online-to-Offline,O2O)本地生活化服務(wù),極大的方便了人們的生活。與網(wǎng)頁(yè)不同,O2O行業(yè)的信息描述載體往往都具有多個(gè)文本域,從不同的角度嘗試對(duì)服務(wù)進(jìn)行具體的描述,例如,餐飲服務(wù)商家可能會(huì)包括商家名稱、商家注冊(cè)公司名稱、品牌名稱、商家所處商圈、商家地址、商家主營(yíng)菜品、商家營(yíng)業(yè)時(shí)間等等字段,這類描述性文本字段有時(shí)多達(dá)五十個(gè)以上。在搜索過(guò)程中,不僅要求若干字段命中,也會(huì)要求按照一些字段進(jìn)行排序。隨著索引數(shù)據(jù)量的增多,單個(gè)文檔的字段數(shù)量增多,搜索引擎會(huì)面臨搜索性能瓶頸,也會(huì)面臨資源瓶頸。造成搜索引擎性能瓶頸的原因,是在沒(méi)有增加存儲(chǔ)設(shè)備的基礎(chǔ)上由于數(shù)據(jù)量增加導(dǎo)致的,數(shù)據(jù)量增加之后會(huì)占用更多的內(nèi)存,在進(jìn)行數(shù)據(jù)檢索時(shí),檢索效率降低。
發(fā)明內(nèi)容
有鑒于此,本申請(qǐng)的目的在于提供一種數(shù)據(jù)搜索方法和裝置,用于解決現(xiàn)有技術(shù)中由于數(shù)據(jù)量增加導(dǎo)致的檢索效率低的問(wèn)題。
第一方面,本申請(qǐng)實(shí)施例提供了一種數(shù)據(jù)搜索方法,該方法包括:
獲取描述索引文件的文件描述信息,所述文件描述信息包括關(guān)鍵詞索引的描述信息和索引數(shù)據(jù)的描述信息;所述關(guān)鍵詞索引包括關(guān)鍵詞與數(shù)據(jù)標(biāo)識(shí)之間的映射關(guān)系;
根據(jù)所述文件描述信息,由所述索引文件中獲取所述關(guān)鍵詞索引并加載到頁(yè)高速緩沖存儲(chǔ)器中,由所述索引文件中獲取所述索引數(shù)據(jù)并加載到Java虛擬機(jī)內(nèi)存中;
根據(jù)搜索關(guān)鍵詞由所述頁(yè)高速緩沖存儲(chǔ)器查詢所述關(guān)鍵詞索引,得到與所述搜索關(guān)鍵詞對(duì)應(yīng)的數(shù)據(jù)標(biāo)識(shí),根據(jù)所述數(shù)據(jù)標(biāo)識(shí)由所述Java虛擬機(jī)內(nèi)存中的所述索引數(shù)據(jù)獲得結(jié)果數(shù)據(jù)。
可選地,所述文件描述信息包括所述關(guān)鍵詞索引和所述索引數(shù)據(jù)分別在所述索引文件中的起始位置和數(shù)據(jù)長(zhǎng)度;
所述根據(jù)所述文件描述信息,由所述索引文件中獲取所述關(guān)鍵詞索引并加載到所述頁(yè)高速緩沖存儲(chǔ)器中,由所述索引文件中獲取所述索引數(shù)據(jù)并加載到所述Java虛擬機(jī)內(nèi)存中,包括:
根據(jù)所述關(guān)鍵詞索引在所述索引文件中的所述起始位置和所述數(shù)據(jù)長(zhǎng)度,由所述索引文件中獲取所述關(guān)鍵詞索引并加載到所述頁(yè)高速緩沖存儲(chǔ)器中;
根據(jù)所述索引數(shù)據(jù)在所述索引文件中的所述起始位置和所述數(shù)據(jù)長(zhǎng)度,由所述索引文件中獲取所述索引數(shù)據(jù)并加載到所述Java虛擬機(jī)內(nèi)存中。
可選地,所述關(guān)鍵詞索引包括第一關(guān)鍵詞索引;
根據(jù)所述關(guān)鍵詞索引在所述索引文件中的所述起始位置和所述數(shù)據(jù)長(zhǎng)度,由所述索引文件中獲取所述關(guān)鍵詞索引并加載到所述頁(yè)高速緩沖存儲(chǔ)器中,包括:
根據(jù)所述第一關(guān)鍵詞索引在所述索引文件中的所述起始位置和所述數(shù)據(jù)長(zhǎng)度,由所述索引文件中獲取所述第一關(guān)鍵詞索引并加載到所述頁(yè)高速緩沖存儲(chǔ)器中。
可選地,所述關(guān)鍵詞索引還包括第二關(guān)鍵詞索引;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京三快在線科技有限公司,未經(jīng)北京三快在線科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810040291.5/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 在多實(shí)體標(biāo)識(shí)情況中管理實(shí)體數(shù)據(jù)
- 數(shù)據(jù)同步的方法和系統(tǒng)
- 一種數(shù)據(jù)處理方法及裝置
- 校準(zhǔn)數(shù)據(jù)標(biāo)識(shí)
- 醫(yī)療數(shù)據(jù)跟蹤方法及裝置、存儲(chǔ)介質(zhì)、電子設(shè)備
- 生成數(shù)據(jù)表標(biāo)識(shí)的方法及裝置
- 數(shù)據(jù)請(qǐng)求的處理方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 數(shù)據(jù)脫敏方法和相關(guān)裝置
- 一種緩存數(shù)據(jù)調(diào)取方法及裝置
- 磁性數(shù)據(jù)標(biāo)識(shí)
- 數(shù)據(jù)處理裝置和為值串形式索引值建立索引的方法
- 一種索引數(shù)據(jù)處理方法及設(shè)備
- 數(shù)據(jù)索引裝置和數(shù)據(jù)索引方法
- 一種索引建立方法及系統(tǒng)、檢索方法及系統(tǒng)
- 一種管理索引的方法及裝置
- 視頻監(jiān)控索引數(shù)據(jù)的備份方法和裝置
- 支持海量數(shù)據(jù)分組統(tǒng)計(jì)的智能索引構(gòu)建、查詢及維護(hù)方法
- 一種索引數(shù)據(jù)更新的方法以及相關(guān)裝置
- 一種應(yīng)對(duì)可追加數(shù)據(jù)的索引方法
- 一種增量索引更新方法及系統(tǒng)





