[發明專利]存儲高效、更新優化的事務型全文索引視圖維護的方法和系統有效
| 申請號: | 201380050962.1 | 申請日: | 2013-09-20 |
| 公開(公告)號: | CN104854582B | 公開(公告)日: | 2019-03-01 |
| 發明(設計)人: | E·C·比歇;P·普列沙奇科夫;S·權;S·黃 | 申請(專利權)人: | EMC公司 |
| 主分類號: | G06F16/951 | 分類號: | G06F16/951 |
| 代理公司: | 中國專利代理(香港)有限公司 72001 | 代理人: | 張金金;姜甜 |
| 地址: | 美國麻*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 存儲 高效 更新 優化 事務 全文 索引 視圖 維護 方法 系統 | ||
1.一種維護數據庫中所存儲的元素的索引的計算機實現的方法,在基于查詢的、全文搜索環境中使用,該方法包括:
采用所述數據庫的原始索引將刪除的元素列入黑名單,其中所述黑名單被表示為指示所述數據庫中每個元素的黑名單狀態的黑名單位圖,所述黑名單位圖包括具有位序列的數據結構,每個位被分配布爾值,其中第一布爾值表示元素在所述黑名單中存在,第二布爾值表示元素在所述黑名單中不存在;
在采用原始索引將刪除的元素列入黑名單之后,將所述原始索引劃分為多個較小的索引;
在所述多個較小索引中的至少一個以及所述原始索引上執行查詢。
2.如權利要求1所述的方法,其中所述元素包括搜索引擎可搜索的文檔。
3.如權利要求1所述的方法,其中所述黑名單位圖使用與所述數據庫的原始索引中的每個元素關聯的數字文檔標識符。
4.如權利要求3所述的方法,其中每個數字文檔標識符定義用于所述黑名單位圖的映射。
5.如權利要求2所述的方法,其中所述數據結構進一步包括根據多個日志序號所組織的事務。
6.如權利要求5所述的方法,其中所述日志序號按照升序被分配并被實現為日志記錄的邏輯地址,其中所述日志記錄被創建以跟蹤由事務所做出的變化。
7.一種用于維護數據庫中所存儲的元素的索引的系統,在基于查詢的、全文搜索環境中使用,該系統包括:
基于處理器的數據庫管理系統,在計算機上被執行并被配置為:
采用所述數據庫的原始索引將刪除的元素列入黑名單,其中所述黑名單被表示為指示所述數據庫中每個元素的黑名單狀態的黑名單位圖,所述黑名單位圖包括具有位序列的數據結構,每個位被分配布爾值,其中第一布爾值表示元素在所述黑名單中存在,第二布爾值表示元素在所述黑名單中不存在;
在采用原始索引將刪除的元素列入黑名單之后,將所述原始索引劃分為多個較小的索引;
在所述多個較小索引中的至少一個以及所述原始索引上執行查詢。
8.如權利要求7所述的系統,其中所述元素包括搜索引擎可搜索的文檔。
9.如權利要求7所述的系統,其中所述黑名單位圖使用與所述數據庫的原始索引中的每個元素關聯的數字文檔標識符。
10.如權利要求9所述的系統,其中每個數字文檔標識符定義用于所述黑名單位圖的映射。
11.如權利要求8所述的系統,其中所述數據結構進一步包括根據多個日志序號所組織的事務。
12.如權利要求11所述的系統,其中所述日志序號按照升序被分配并被實現為日志記錄的邏輯地址,其中所述日志記錄被創建以跟蹤由事務所做出的變化。
13.一種包含有計算機可讀程序代碼的非瞬態計算機可讀介質,所述計算機可讀程序代碼適合被一個或多個處理器執行以實現方法,該方法包括:
采用數據庫的原始索引將刪除的元素列入黑名單,其中所述黑名單被表示為指示所述數據庫中每個元素的黑名單狀態的黑名單位圖,所述黑名單位圖包括具有位序列的數據結構,每個位被分配布爾值,其中第一布爾值表示元素在所述黑名單中存在,第二布爾值表示元素在所述黑名單中不存在;
在采用原始索引將刪除的元素列入黑名單之后,將所述原始索引劃分為多個較小的索引;
在所述多個較小索引中的至少一個以及所述原始索引上執行查詢。
14.如權利要求13所述的非瞬態計算機可讀介質,其中所述元素包括搜索引擎可搜索的文檔。
15.如權利要求14所述的非瞬態計算機可讀介質,其中所述黑名單位圖使用與所述數據庫的原始索引中的每個元素關聯的數字文檔標識符。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于EMC公司,未經EMC公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201380050962.1/1.html,轉載請聲明來源鉆瓜專利網。





