[發(fā)明專利]面向可變錯誤率的檢查點間隔實時確定方法有效
| 申請?zhí)枺?/td> | 201410683405.X | 申請日: | 2014-11-25 |
| 公開(公告)號: | CN104331347A | 公開(公告)日: | 2015-02-04 |
| 發(fā)明(設計)人: | 賈文濤;張春元;李宗伯;楊乾明;羅磊;薛云剛;藍強 | 申請(專利權)人: | 中國人民解放軍國防科學技術大學 |
| 主分類號: | G06F11/14 | 分類號: | G06F11/14;G06F9/44 |
| 代理公司: | 國防科技大學專利服務中心 43202 | 代理人: | 郭敏 |
| 地址: | 410073 湖*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 面向 可變 錯誤率 檢查點 間隔 實時 確定 方法 | ||
技術領域
本發(fā)明涉及錯誤率變化時容錯處理器的檢查點間隔確定方法,特別是在錯誤率變動明顯時的檢查點間隔實時確定方法。
背景技術
軟錯誤是處理器面對的主要威脅,目前主要的容錯方式是冗余檢錯+檢查點恢復。其運行方式是應用程序以雙模冗余或雙線程的方式執(zhí)行,執(zhí)行中比較運行狀態(tài)進行檢錯,定時的備份程序狀態(tài),檢測出錯誤后返回到已備份的檢查點重新執(zhí)行。
在檢查點系統(tǒng)中,應用通常有三個狀態(tài):應用運行狀態(tài)、檢查點狀態(tài)和錯誤恢復狀態(tài),容錯的過程就是應用在三個狀態(tài)中轉移的過程。檢查點系統(tǒng)的任務就是控制應用狀態(tài)的轉移。傳統(tǒng)的檢查點系統(tǒng)由檢查點控制模塊和錯誤恢復模塊組成。檢查點控制模塊的任務是:獲取應用的運行狀態(tài)信息以檢測錯誤,檢測出錯誤時喚醒檢查點控制模塊,控制應用進入檢查點和結束檢查點狀態(tài)。錯誤恢復模塊在收到檢查點控制模塊發(fā)出的“檢測到錯誤”消息時控制整個系統(tǒng)進行錯誤恢復,在錯誤恢復完成后控制應用返回應用運行狀態(tài)。
在介紹技術方案之前,先給出幾個定義:
●Tex:檢查點間隔時間,當檢查點間隔時間到達時進行檢查點的更新備份;
●Tov:更新檢查點的時間開銷;
●MTTE:(Mean?Time?To?Error):發(fā)生一次錯誤的平均時間,表征錯誤率。
以上三個參數(shù)是常量,是傳統(tǒng)檢查點系統(tǒng)的主要參數(shù)。本發(fā)明中,與之對應的參數(shù)會隨著時間發(fā)生變化,我們定義如下:
●ti:第i次錯誤發(fā)生的時刻,t0為系統(tǒng)開始運行的初始時間;
●tj:第j次檢查點間隔到達的時間;
●Tex(j):第j次檢查點的間隔時間;
●Tov(j):第j次檢查點更新的開銷時間;
●MTTE(tj):時刻tj時的系統(tǒng)平均錯誤時間;
●p:計算系統(tǒng)平均錯誤時間的權值;
●tsys:當前的系統(tǒng)時間;
●tstart:當前檢查點開始的時刻;
●context(j):第j次檢查點達到時應用線程的運行狀態(tài)信息。
傳統(tǒng)檢查點系統(tǒng)的運行通常有三個步驟。
第一步,檢查點控制模塊通過系統(tǒng)時間判定當前檢查點間隔是否完成。
1.1檢查點控制模塊對整個檢查點系統(tǒng)進行初始化。包括設定檢查點間隔(傳統(tǒng)的檢查點間隔是一個固定的時間參數(shù));設定應用初始狀態(tài)為應用運行狀態(tài)。
1.2檢查點控制模塊讀取當前的系統(tǒng)時間tsys,并與1.1中設定的檢查點間隔對比,如果tsys<tstart+Tex就返回1.2繼續(xù)讀取并對比,否則轉至第二步。
第二步,檢查點控制模塊檢測錯誤,并根據(jù)檢錯結果更新檢查點或進行錯誤恢復。
2.1檢查點控制模塊向應用發(fā)送“啟動檢查點”的消息。應用收到消息后立即進入檢查點狀態(tài),并向檢查點控制模塊發(fā)送自己的運行狀態(tài)信息。
2.2檢查點控制模塊獲取應用線程的運行狀態(tài)信息,線程的運行狀態(tài)信息主要是線程控制塊,包括程序計數(shù)器、CPU寄存器、存儲器管理信息等。
2.3檢查點控制模塊比對冗余線程的運行狀態(tài)信息檢測錯誤。容錯執(zhí)行時,每個應用線程都會有一個對應的冗余線程,其執(zhí)行的程序與對應的應用線程完全相同,如果相互冗余的兩個線程狀態(tài)信息相同,則此線程無誤,執(zhí)行2.4。如果相互冗余的兩個線程狀態(tài)信息不同,則說明此線程有誤,轉至2.5。
2.4:檢查點控制模塊啟動DMA(Direct?Memory?Access),用應用當前的檢查點狀態(tài)信息更新前一次保存的狀態(tài)信息。更新完成后檢查點控制模塊向應用發(fā)送“檢查點更新完成”消息,轉至第三步。
2.5檢查點控制模塊喚醒錯誤恢復模塊,錯誤恢復模塊給應用發(fā)送“錯誤恢復開始”消息并轉至2.6以進行錯誤恢復。
2.6:錯誤恢復模塊啟動DMA為應用恢復之前保存的檢查點狀態(tài)。恢復成功后,錯誤恢復模塊給應用發(fā)送“錯誤恢復完成”消息并轉至第三步。
第三步,檢查點控制模塊重設檢查點的開啟。
3.1:檢查點控制模塊根據(jù)應用線程的狀態(tài)判定應用是否已經(jīng)結束。如果應用結束則執(zhí)行3.2,否則轉至3.3。
3.2:檢查點控制模塊結束檢查點系統(tǒng)運行。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國人民解放軍國防科學技術大學,未經(jīng)中國人民解放軍國防科學技術大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410683405.X/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:便攜車載冷暖箱
- 下一篇:汽車座椅前排靠背結構





