[發明專利]針對分布式存儲系統中的變化檢測的動態散列函數組合在審
| 申請號: | 202080030703.2 | 申請日: | 2020-03-30 |
| 公開(公告)號: | CN113767377A | 公開(公告)日: | 2021-12-07 |
| 發明(設計)人: | T·克勒策;A·A·克瓦爾內斯;O·托爾比約恩森;J-O·卡爾伯格 | 申請(專利權)人: | 微軟技術許可有限責任公司 |
| 主分類號: | G06F16/172 | 分類號: | G06F16/172;G06F16/182 |
| 代理公司: | 永新專利商標代理有限公司 72002 | 代理人: | 賈麗萍 |
| 地址: | 美國華*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 針對 分布式 存儲系統 中的 變化 檢測 動態 函數 組合 | ||
本文公開了針對分布式存儲系統中的變化檢測的動態散列函數組合的技術。在一個實施例中,一種方法包括:針對文檔的新版本的屬性動態選擇散列函數,并使用所選擇的散列函數生成所述屬性的所述值的散列值。方法然后可以包括:確定接收到的新版本的屬性的生成的散列值是否與分布式存儲系統中文檔的先前版本的屬性的散列值不同。響應于確定生成的散列值與文檔的先前版本的散列值不同,可以向先前注冊為接收關于屬性變化的通知的一個或多個計算服務發送通知,而不向未注冊為接收所述通知的其他計算服務發送所述通知。
背景技術
分布式存儲系統通常包括路由器、交換機、網橋和其他網絡設備,它們經由有線或無線網絡鏈路將大量計算機服務器、網絡存儲設備和其他類型的計算設備互連起來。計算機服務器可以托管一個或多個虛擬機、容器或其他類型的虛擬化組件,以便向用戶提供各種計算和/或存儲服務。例如,計算機服務器可以被配置為:提供允許用戶存儲、編輯、檢索或執行其他數據管理任務的數據存儲和檢索服務。
發明內容
提供本發明內容以便以簡化的形式對下面在具體實施方式中進一步描述的設計構思的選擇進行介紹。本發明內容并不旨在標識要求保護的主題的關鍵特征或重要特征,也不旨在用于限制要求保護的主題的范圍。
當今的分布式存儲系統通常按照分層架構進行布置,以便為大量用戶提供可靠且可擴展的存儲服務。分布式存儲系統的每一層都可以依賴相應的計算系統來提供設計的服務。例如,分布式存儲系統可以包括高度可擴展且能夠存儲大量數據的存儲層。存儲層通常可以包括一組后端服務器,這些后端服務器被配置為:促進用戶的存儲、檢索和/或其他數據管理任務。這組后端服務器還可以提供用于執行各種數據分析或分析任務的計算資源。此類分析任務的示例包括文檔視圖的聚合、修改信號的檢測、趨勢文檔的計算等。此類存儲層的一個示例是由華盛頓州雷德蒙德市的微軟公司提供的Microsoft Outlook
雖然存儲層適合執行大量數據的存儲和分析,但存儲層中使用的數據結構可能不適合提供對個體數據項的隨機訪問。例如,存儲層可能不會在與數據項在列表中的位置或列表的大小無關的恒定時間訪問列表中的數據項。此外,這種分布式存儲系統的可擴展性通常是通過將存儲的數據或對此類數據的索引拆分或“分片”到分區中來實現的。例如,在某些分布式存儲系統中,存儲層中數據項的主索引可以被拆分為多個子索引。代替引用數據項,主索引可以引用子索引,而子索引又可以引用數據項。在這樣的分布式存儲系統中,當用戶請求存儲的數據項時,在存儲層中執行多個操作(例如,扇出聯合)以對此類引用進行解析。執行多個操作可能會導致服務用戶請求的高延時和計算負載。
一種用于提供對存儲數據的快速隨機訪問的技術是將所存儲的數據的子集(有時被稱為“高影響數據”)高速緩存在被配置為提供針對高影響數據的高速緩存服務的集中式存儲庫中。例如,在存儲層中運行的一組分析服務器和/或計算過程(在本文中被稱為“攝取處理器”)可以被配置為:將所存儲的數據的子集作為高影響數據推送到集中式存儲庫中。推送到集中式存儲庫的高影響數據可以包括各種場景計算服務可能感興趣的各種類別的存儲的數據。在一個示例中,在集中式存儲庫中高速緩存的針對存儲層中存儲的文檔的高影響數據可以包括文檔名稱、文檔擴展(例如“txt”)、最后更新的日期/時間、查看文檔的次數、修改文檔的次數、可以檢索到文檔的通用資源定位符(URL)和/或與文檔相關的其他合適信息。通過對高影響數據進行高速緩存,用戶可以容易地從集中式存儲庫中檢索文檔和/或文檔的其他相關信息。
場景計算服務可以被配置為:從集中式存儲庫中檢索高速緩存的高影響數據,并對存儲層中存儲的底層數據的變化做出反應,以提供相應的用戶體驗。例如,在上面的文檔示例中,搜索索引服務可能對用于更新搜索索引的標題、主體、附錄或其他合適類型的文檔內容的變化感興趣。另一方面,文檔元數據服務可能對用于更新對文檔的查看/編輯的次數的文檔的查看者列表和文檔的最后修改的時間戳感興趣。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于微軟技術許可有限責任公司,未經微軟技術許可有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202080030703.2/2.html,轉載請聲明來源鉆瓜專利網。





