[發(fā)明專利]一種基于事務聚集的日志組織結構及實現其相應的恢復協(xié)議的方法無效
| 申請?zhí)枺?/td> | 201210191566.8 | 申請日: | 2012-06-12 |
| 公開(公告)號: | CN102760161A | 公開(公告)日: | 2012-10-31 |
| 發(fā)明(設計)人: | 徐昶;馮柯;蔡華林;蔣志勇;何清法;周麗霞;顧云蘇;曹暉;李陽;饒路 | 申請(專利權)人: | 天津神舟通用數據技術有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F11/34 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 300384 天津市華*** | 國省代碼: | 天津;12 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 事務 聚集 日志 組織 結構 實現 相應 恢復 協(xié)議 方法 | ||
技術領域
本發(fā)明設計屬于數據信息處理領域,特別涉及使用日志技術來保證數據一致性的事務性數據管理系統(tǒng)。
背景技術
在馮氏計算機體系結構中,永久性數據被存放在速度較慢、容積較大的外存設備中(如硬盤),而當數據被訪問時,它被讀入速度較快、容積較小的內存設備中(如RAM),并被中央處理器訪問。然而由于性能的要求,數據在更新時只更新其內存映像,而對外存的更新由緩沖區(qū)管理單元延時進行。
在事務性數據管理系統(tǒng)中,單個事務——即由若干條更新所組成的一次操作過程——被視為一個基本工作單元,它有兩條重要的性質,一為一致性,即所有對數據的更新必須同時被看到,或者完全看不到;二是持久性,即當事務提交時,所有對數據的更新必須永久保存到系統(tǒng)中。在大量并發(fā)事務同時工作的情況下,一致性和持久性是保證整個系統(tǒng)正確運行的必備條件。但由于數據的外存映像總是延遲于內存的最新版本,因此當系統(tǒng)發(fā)生故障時,此時外存的數據版本可能丟失已提交事務的更新(破壞持久性),也可能保存了未提交事務的更新(破壞一致性)。
目前所有的事務性數據管理系統(tǒng)均采用基于日志的恢復協(xié)議來恢復系統(tǒng),以實現一致性和持久性。這一協(xié)議可以被簡要描述如下:日志是外存上的一個流結構文件,系統(tǒng)在內存中維護一個日志緩沖區(qū),其中存放最近產生的日志。當事務A準備對數據頁面P進行一條更新U時,系統(tǒng)向日志緩沖區(qū)中產生一條日志(S,A,P,U,Cp,Cs,Sprev),其中S是本條日志在日志流中的唯一日志序列編號(隨時間單調遞增),Cp是更新的數據前項,Cs是更新的數據后項,而Sprev是事務A的上一條更新日志的日志序列編號。事務在更新前,將S寫在P上。而數據緩沖區(qū)管理單元和事務管理單元必須遵循以下原則:1)當數據頁面被數據緩沖區(qū)管理單元寫回外存時,其頁面上的唯一日志序列編號之前的日志必須被先物化到外存日志文件中。2)當事務提交時,此時日志緩沖區(qū)內的所有日志必須被物化到外存日志文件中。
當整個系統(tǒng)發(fā)生故障時,首先掃描外存已經物化的日志文件,每條日志S對應的頁面P被讀入內存,并檢查頁面上的日志序列編號S’與S之間的關系,如果S’小于S,則說明頁面的外存版本在本條日志更新之前,此時本條日志需要被重做,并將頁面序列號更新到S,如果S’大于S,則說明本條日志對應的更新已經物化過了,不需要重做。由于事務提交時必須物化所有的日志,因此事務的持久性得到了保證。當所有日志都被掃描并按需重做后,同時也構建了發(fā)生故障時的活躍事務表,由于同一事務的更新日志被通過日志的Sprev域鏈接起來,因此可以回退所有的更新日志,使數據庫恢復到一致狀態(tài)。
上述日志結構和恢復協(xié)議在現代計算機系統(tǒng)中存在著一定的問題。首先,單條日志的體積較大,由于每條日志必須記錄日志序列編號S,事務號A,事務日志前項Sprev,這些域加起來的長度往往超過20字節(jié),而如果一條更新本身操作的數據較短時,這些域所占的空間往往接近整個日志文件空間的1/3甚至1/2;其次,由于產生日志的動作必須全局同步以保證日志序列的唯一遞增性,而當前的大型計算機往往擁有幾十甚至上百個中央處理器,當更新密集發(fā)生時,會造成延展性的瓶頸。
發(fā)明內容
本發(fā)明目的在于提供一種按事務聚集的日志組織結構,以及基于其上的恢復協(xié)議的實現方法,以達到減小日志文件體積,提高系統(tǒng)在高并發(fā)條件下的性能的目標。
為達到上述目標,本發(fā)明是通過以下技術方案實現的:
一種按事務聚集的日志組織結構。日志文件被順序組織為若干個日志片,每個日志片的長度可以不一樣,但都為外存設備基本塊單元長度的整數倍。
所述日志文件組織結構中的一個日志片存放同一個事務的日志內容,其基本結構為:(S,A,Pn,Ln,Pa,La,Sprev)。其中,S代表本日志片在日志文件中的唯一日志序列編號,A代表本日志片的相關事務號,Pn代表本日志片所涉及的數據頁面數目,Ln代表本日志片所包含的日志數目,它們都是定長的域。面Pa是本日志片中的日志涉及的所有頁面的頁面號數組,數組共有Pn個定長的項,每項代表一個單獨的數據頁面編號。La是所有的日志項數組,數組共有Ln個變長的項,每項代表一條單獨的日志。Sprev為本事務的上一日志片的序列號。
所述日志片中的頁面號數組Pa按照頁面號排序,以便于通過二分法快速定位訪問。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于天津神舟通用數據技術有限公司,未經天津神舟通用數據技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210191566.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:拌料機
- 下一篇:一種防偽封印檢驗識別系統(tǒng)





