[發明專利]用于進行數據倉儲的設備和方法有效
| 申請號: | 200580047505.2 | 申請日: | 2005-12-14 |
| 公開(公告)號: | CN101305365A | 公開(公告)日: | 2008-11-12 |
| 發明(設計)人: | 克里斯托弗·R·貝爾;保羅·J·博得;馬克·E·鄧拉普 | 申請(專利權)人: | 亞馬遜科技公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 中國國際貿易促進委員會專利商標事務所 | 代理人: | 杜娟 |
| 地址: | 美國*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 進行 數據 倉儲 設備 方法 | ||
技術領域
本發明涉及計算機系統,更具體地說,涉及數據倉儲系統的實現。
背景技術
隨著企業內的商業機能數量的增加,企業所產生的數據量也相應地增加了。這種數據可能分布在整個企業內,例如在由不同部門或地理單元實現的數據庫系統和其他類型的系統內。在某些情況下,可以跨越現有系統或位置之間的自然邊界對企業數據進行有用分析。為了便于進行這種分析,可以采用數據倉儲系統將來自多個不同系統或位置的數據匯集在單個系統內,如單個數據庫內。隨后,分析工具可以將該單個、經匯集的系統而不是各種分布式數據源作為目標,這可以簡化分析工具的設計并改進分析性能。
通常,數據倉儲系統利用被配置成提供所需分析性能的高端計算機系統來支持對非常大量的數據的存儲和查詢。然而,非常適合于特定數據倉儲應用的高端系統的采購和維護費用可能是高昂的,并且可能無法隨著企業的數據倉儲需求的增長而擴縮。如果例如由于昂貴而只提供單個數據倉儲系統,那么在該單個倉庫發生故障時會損害數據可用性。另一方面,如果提供多個數據倉儲系統,那么分析應用會喪失采用單個、經匯集的數據源的簡單性。例如,可能需要將分析應用配置成對多個數據倉庫內的期望數據的位置進行跟蹤。
發明內容
公開了用于實現數據倉儲系統的設備和方法的各種實施例。根據一個實施例,一種系統可以包括:若干數據倉庫;和數據倉庫管理器,其被配置成從一個或更多個數據源提取數據集合以存儲在所述多個數據倉庫中的一個或更多個中。兩個或更多個數據倉庫中的每一個都可被配置成存儲由所述數據倉庫管理器提取的數據集合的相應副本。此外,所述數據倉庫管理器可以被配置成在所述數據集合的每個相應副本被存儲到對應的一個另外數據倉庫之前允許由所述多個數據倉庫中的一個數據倉庫對依賴于所述數據集合的查詢進行評估。類似地,所述數據倉庫管理器還可以被配置成在已將所述數據集合的修改復制到對應的另外數據倉庫之前允許由所述多個數據倉庫中的一個數據倉庫對依賴于所述數據集合的查詢進行評估。
還構思了一種方法,根據一個實施例,該方法可以包括以下步驟:從一個或更多個數據源提取數據集合以存儲在一個或更多個數據倉庫中;將第一數據集合的相應副本存儲在包括兩個或更多個數據倉庫的第一子集中的每個數據倉庫中;以及在所述第一數據集合的每個相應副本被存儲到所述第一子集中的對應數據倉庫之前允許由數據倉庫的所述第一子集中的一個數據倉庫對依賴于所述第一數據集合的查詢進行評估。
根據第二實施例,一種系統可以包括:多個數據倉庫,其被配置成存儲從一個或更多個數據源提取的數據集合;和數據倉庫管理器,其被配置成將所述多個數據倉庫作為單個數據倉庫呈現給客戶機。所述多個數據倉庫內的所述數據集合的位置對于所述客戶機來說可以是透明的。而且,在給定時刻,由第一數據倉庫存儲的并且在所述給定時刻可供所述客戶機進行查詢的第一數據集合可能與由第二數據倉庫存儲的并且在所述給定時刻也可供所述客戶機進行查詢的第二數據集合不相似。所述數據倉庫管理器還可以被配置成響應于接收到來自所述客戶機的針對由所述多個數據倉庫中的一個或更多個數據倉庫所存儲的數據集合的查詢的接收,對所述多個數據倉庫中的能夠對所述查詢進行評估的一個特定數據倉庫進行識別并將所述查詢傳送給所述特定數據倉庫以進行評估。
還構思了一種方法,根據一個實施例,該方法可以包括以下步驟:從一個或更多個數據源提取數據集合以存儲在一個或更多個數據倉庫中,并將所述多個數據倉庫作為單個數據倉庫呈現給客戶機。所述多個數據倉庫內的所述數據集合的位置對于所述客戶機來說可以是透明的。響應于對來自所述客戶機的針對由所述多個數據倉庫中的一個或更多個數據倉庫所存儲的數據集合的查詢的接收,該方法還可以包括以下步驟:對所述多個數據倉庫中的能夠對所述查詢進行評估的一個特定數據倉庫進行識別并將所述查詢傳送給所述特定數據倉庫以進行評估。在給定時刻,由第一數據倉庫存儲的并且在所述給定時刻可供所述客戶機進行查詢的第一數據集合可能與由第二數據倉庫存儲的并且在所述給定時刻可供所述客戶機進行查詢的第二數據集合不相似。
附圖說明
圖1是例示了數據倉儲系統的一個實施例的框圖。
圖2是例示了跨越多個數據倉庫的數據集合復制處理的一個實施例的框圖。
圖3是例示了利用粗同步將所提取的數據存儲在數據倉庫中的方法的一個實施例的流程圖。
圖4是例示了利用粗同步對由數據倉庫存儲的數據進行查詢的方法的一個實施例的流程圖。
圖5A是例示了在粗同步下在數據集合更新與查詢之間的關系的一個實施例的時序圖。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于亞馬遜科技公司,未經亞馬遜科技公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200580047505.2/2.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





