[發明專利]利用虛擬分區的數據庫重新分布方法和系統有效
| 申請號: | 201110360026.3 | 申請日: | 2011-11-15 |
| 公開(公告)號: | CN102541990A | 公開(公告)日: | 2012-07-04 |
| 發明(設計)人: | N·沙馬;S·佳因 | 申請(專利權)人: | 國際商業機器公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 中國國際貿易促進委員會專利商標事務所 11038 | 代理人: | 杜娟 |
| 地址: | 美國*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 利用 虛擬 分區 數據庫 重新 分布 方法 系統 | ||
技術領域
本發明總地涉及數據處理,更具體地涉及分區數據庫(partitioned?database)的重新分布(redistribution)。
背景技術
在存儲大量數據的計算環境中,通常通過關系數據庫管理系統(RDBMS)管理數據,RDBMS可以用于對一個或多個數據庫進行實例化以便存儲、訪問和操縱數據。每個數據庫包括一個或多個表格空間,表格空間進而根據關系數據模型存儲表格數據。如表格組織所暗示的,邏輯上按行和列排列表格數據,每個表格行具有相關聯的行密鑰(row?key)。
為了提供改進的可管理性、性能和/或可用性,通常將關系數據庫劃分成多個邏輯或物理分區(下文簡稱為“分區(partition)”,除非需要更確切含義),每個分區具有它自己的數據、索引、配置文件、和事務處理日志??梢詫⑷魏谓o定表格的表格數據定位在一個或多個分區中,表格數據駐留在其上的分區通常由散列函數確定。因為數據被跨數據庫分區分布,所以可以級聯地利用可能位于多個計算機上的多個處理器的能力來存儲、檢索、處理和管理數據庫中的數據。
隨著所存儲數據的量不斷增加,諸如在線事務處理(OLTP)系統、數據倉儲(data?warehousing)企業、金融和保險公司等的管理大數據量的企業經常需要擴大它們的數據存儲和處理容量。例如,企業可以將一個或多個附加服務器以及它們的相關聯的存儲節點添加到企業的現有信息技術(IT)基礎設施中,以便在避免查詢響應時間惡化的同時管理增加的數據量。
為了利用附加服務器,RDBMS必須重新分布和重新組織一個或多個數據庫實例,使得數據庫實例不僅駐留在現有服務器的存儲節點上,而且駐留在新安裝服務器的存儲節點上。RDBMS根據現有技術重新分布和重新組織數據庫的傳統過程描繪在圖1中。
重新分布和重新組織數據庫的傳統過程從框100開始,此后轉到框102,框102描繪了RDBMS做出要重新分布的整個數據庫的備份。取決于數據庫的大小,做出數據庫的備份可能消耗相當長的處理時間(例如,數天或數星期)。然后該過程進入包括框104-118的迭代循環,其中跨現有和新存儲節點逐行重新分布數據庫。重新分布從框104開始,框104描繪了RDBMS讀取要處理的下一個數據庫行的密鑰值。然后,RDBMS重新散列數據庫行的密鑰值,以確定重新分布之后數據庫行將駐留在其上的目標分區號(框106)。在框110中,RDBMS確定目標分區號是否與現有分區號相同,即意味著數據庫行將不被移動。如果目標分區號與現有分區號匹配,則該過程轉到如下所述的框118。但是,如果目標分區號與現有分區號不匹配,則該過程轉到框112-116。
在框112-116中,RDBMS從先有(preexisting)存儲節點讀取整個數據庫行,將該數據庫行插入新添加的存儲節點上的新分區中,然后從先有存儲節點中刪除該數據庫行。此后,在框118中,RDBMS確定數據庫的所有行是否都已被處理。如果不是,則該過程返回到已經描述過的框104。但是,如果RDBMS在框118中確定數據庫的所有行都被處理,則該過程轉到框120。
應該理解,經由框104-118中所描繪的重新分布將所選數據庫行從先有存儲節點移動到新安裝存儲節點使先有存儲節點被稀疏地填充(sparsely?populated),因此未得到有效利用。因此,在框120中,RDBMS重新組織先有存儲節點中的數據庫行,使數據庫返回到緊湊存儲組織。如果成功地完成重新組織,那么RDBMS在框122中做出整個數據庫的第二個備份。另外,如框124所描繪,RDBMS執行實用程序來收集有關數據庫的統計,以便重新表征表格空間、索引和分區,并將這些統計記錄在目錄中。最后,在框126中,RDBMS將跨新添加的存儲節點的數據庫重新組織通知給任何分區知曉(partition-aware)應用程序(例如,Internet?InformationServices(IIS))。此后,在框130中結束重新分布和重新組織數據庫的傳統過程。
圖2A-2C描繪了根據現有技術的在新添加的數據存儲節點上數據庫的重新分布和重新組織。具體地說,圖2A描繪了包括填充著數據庫的四個數據庫分區202a-202d的數據存儲系統200。因為數據庫的大小接近當前安裝的數據存儲節點的容量,所以數據倉儲企業可以將一個或多個附加存儲節點添加到數據存儲系統200中,以便支持附加數據庫分區。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國際商業機器公司,未經國際商業機器公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110360026.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:預應力鋼絞線穿束機
- 下一篇:一種抗腫瘤血管生成的適體分子及制備方法





