[發明專利]數據配置方法、索引管理方法、相關裝置以及計算設備有效
| 申請號: | 201610939364.5 | 申請日: | 2016-10-24 |
| 公開(公告)號: | CN107977381B | 公開(公告)日: | 2021-08-27 |
| 發明(設計)人: | 王楠楠;劉若曦 | 申請(專利權)人: | 華為技術有限公司 |
| 主分類號: | G06F16/14 | 分類號: | G06F16/14 |
| 代理公司: | 深圳市深佳知識產權代理事務所(普通合伙) 44285 | 代理人: | 王仲凱 |
| 地址: | 518129 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據 配置 方法 索引 管理 相關 裝置 以及 計算 設備 | ||
本申請提供了一種數據配置方法,用于提升搜索系統的搜索性能。本申請提供的數據配置方法包括:接收用戶下發的多條搜索請求,該多條搜索請求中,每條搜索請求均包括一個或多個搜索字段,用于請求查找包含該搜索字段的數據文件。確定該多條搜索請求所包括的搜索字段中,每個搜索字段所屬的域,并在其中確定一個或多個熱點域。將該一個或多個熱點域添加到schema配置文件中,并根據添加了熱點域的schema配置文件更新搜索系統中的數據文件。本申請還提供了一種索引管理方法、相關裝置和計算設備。
技術領域
本申請涉及數據搜索領域,尤其涉及一種數據配置方法、索引管理方法、相關裝置以及計算設備。
背景技術
全文搜索技術是一種現階段通用的搜索技術,用于根據搜索字段等內容作為搜索入口來搜索得到所需信息。隨著大數據技術的蓬勃發展,用戶數據呈現爆發式的膨脹,故現階段對全文搜索技術的高效性和快捷性的要求也越來越高。
依賴于全文搜索技術的搜索系統主要包括Solr、Elastic等,其中Solr是當前較為流行的企業級搜索系統,其功能包括全文搜索、命中標示、分面搜索、動態聚類、數據庫集成,以及富文本(如Word、PDF)的處理等。本申請僅以Solr為例來對搜索系統進行說明。
搜索系統一般以數據文件(英文:document,簡稱:doc)為基本單位來保存信息。doc中的數據一般被保存為域(英文:field)+域值的結構形式,其中,域用于表示對應的域值的類型,域值用于記錄對應的域的具體取值。
搜索系統中的doc的域由字段配置(英文:schema)配置文件來定義。通過在schema配置文件中定義不同的域,能夠實現按域搜索,提高搜索的速度和效率。
但是,搜索系統中保存有巨量的doc數據,該巨量的doc數據所涵蓋的域的數量更為龐大。現階段的搜索系統依賴于技術人員在schema配置文件中人為的設定多個域,由于技術人員無法預先獲知哪個域會被用戶多次搜索,故設定的域在實際應用中完全有可能很少被用戶搜索。這樣就導致按域搜索功能的使用頻率不高,進而按域搜索帶來的速度和效率的提升很有限,搜索系統的搜索性能達不到用戶要求。
發明內容
本申請提供了一種數據配置方法、索引管理方法、相關裝置以及計算設備,用于提高搜索系統的搜索性能。
本申請第一方面提供了一種數據配置方法,適用于搜索系統。其中,搜索系統中包括多個數據文件,每個數據文件中包括一個或多個域和該一個或多個域對應的域值。域用于表示對應的域值的類型,域值用于記錄對應的域的具體取值。搜索系統中還包括schema配置文件,用于定義所述搜索系統中的數據文件的域。所述數據配置方法包括:接收用戶下發的多條搜索請求,該多條搜索請求中,每條搜索請求均包括一個或多個搜索字段,用于請求查找包含該搜索字段的數據文件。確定該多條搜索請求所包括的搜索字段中,每個搜索字段所屬的域,并在其中確定一個或多個熱點域。將該一個或多個熱點域添加到schema配置文件中,并根據添加了熱點域的schema配置文件更新搜索系統中的數據文件。本申請提供的數據配置方法中,schema配置文件中的域不是由技術人員人為設定的域,而是由搜索系統根據用戶即時下發的搜索請求確定的熱點域。由于熱點域是搜索請求中搜索頻率較高的域,故在后續時間內熱點域有很大的概率能夠被用戶再次搜索。通過向schema配置文件中添加熱點域,能夠提高按域搜索的使用頻率,進而充分發揮了按域搜索帶來的速度和效率的提升,進一步提高了搜索系統的搜索性能。
可選的,該多條搜索請求中可以攜帶有搜索字段所述的域,該多條搜索請求的響應消息中攜帶有搜索字段所述的域。搜索系統根據每條搜索請求和/或每條搜索請求對應的響應消息,確定該多條搜索請求所包括的搜索字段中每個搜索字段所屬的域。
可選的,搜索系統根據每條搜索請求和/或每條搜索請求對應的響應消息中的間隔符,提取出搜索請求和/或響應消息中攜帶的域字段,進而確定該多條搜索請求所包括的搜索字段中每個搜索字段所屬的域。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華為技術有限公司,未經華為技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610939364.5/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:用于生成頁面的方法和裝置
- 下一篇:用于推送信息的方法和裝置
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





