[發(fā)明專利]信息處理裝置和控制方法有效
| 申請?zhí)枺?/td> | 201210425451.0 | 申請日: | 2012-10-30 |
| 公開(公告)號: | CN103198046A | 公開(公告)日: | 2013-07-10 |
| 發(fā)明(設(shè)計)人: | 鯉沼秀之;杉崎剛;植木俊和 | 申請(專利權(quán))人: | 富士通株式會社 |
| 主分類號: | G06F15/16 | 分類號: | G06F15/16 |
| 代理公司: | 北京集佳知識產(chǎn)權(quán)代理有限公司 11227 | 代理人: | 王萍;陳煒 |
| 地址: | 日本神*** | 國省代碼: | 日本;JP |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 信息處理 裝置 控制 方法 | ||
技術(shù)領(lǐng)域
這里討論的實施例涉及一種信息處理裝置、一種控制方法和一種控制程序。
背景技術(shù)
過去,已知對稱多處理器(SMP)技術(shù),其中多個算術(shù)處理單元共享主存儲單元。作為被應(yīng)用該SMP技術(shù)的信息處理系統(tǒng)的一個示例,存在一種如下的信息處理系統(tǒng),其中包括算術(shù)處理單元和主存儲單元的多個節(jié)點連接到同一總線,并且每個算術(shù)處理單元通過總線共享每個主存儲單元。
該信息處理系統(tǒng)通過使用例如窺探(snoop)方案來保持每個節(jié)點的算術(shù)處理單元緩存的數(shù)據(jù)的一致性。
再者,在將共享存儲器用作節(jié)點之間的通信單元的系統(tǒng)中,存在如下技術(shù),其中當檢測節(jié)點的異常時,將待傳送的數(shù)據(jù)轉(zhuǎn)換成表示異常的數(shù)據(jù)并且傳送所轉(zhuǎn)換的數(shù)據(jù)。在該技術(shù)中,接收表示異常的數(shù)據(jù)的節(jié)點放棄接收到的數(shù)據(jù)。
再者,在其中通過交叉開關(guān)連接多個節(jié)點的系統(tǒng)中,存在如下技術(shù),其中當發(fā)生分組通信的停滯時,通過改變通信路徑來繼續(xù)處理。在該技術(shù)中,由節(jié)點傳送的請求從交叉開關(guān)傳送到其自身的節(jié)點和其他節(jié)點。在該技術(shù)中,傳送請求的節(jié)點測量從傳送請求到接收請求的時間,檢測超時,并且確定已發(fā)生分組通信的停滯。
再者,在其中通過交叉開關(guān)連接多個節(jié)點的系統(tǒng)中,存在如下技術(shù),其中在中斷從節(jié)點傳送的數(shù)據(jù)的情況下,當中斷時間等于或長于預(yù)定時間時,包括表示異常的數(shù)據(jù)的偽數(shù)據(jù)被傳送到接收側(cè)的節(jié)點。
專利文獻1:日本公開專利公布第2004-013723號
專利文獻2:日本公開專利公布第2002-366451號
專利文獻3:日本公開專利公布第11-168502號
然而,上述技術(shù)具有不能抑制當發(fā)生與節(jié)點之間的數(shù)據(jù)傳送相關(guān)的異常時的錯誤影響范圍的問題。
例如,在通過使用窺探方案保持緩存數(shù)據(jù)的一致性的信息處理系統(tǒng)中,可以考慮如下情況。就是說,當在某個節(jié)點中發(fā)生故障(節(jié)點關(guān)閉)并且發(fā)生節(jié)點之間的通信異常時,可以考慮將所有節(jié)點關(guān)閉以保持緩存數(shù)據(jù)的一致性。在該情況下,錯誤影響范圍達到所有節(jié)點。
因此,本發(fā)明的實施例的一個方面的目的在于抑制當發(fā)生與節(jié)點之間的數(shù)據(jù)傳送相關(guān)的異常時的錯誤影響范圍。
發(fā)明內(nèi)容
根據(jù)實施例的一個方面,一種信息處理裝置包括:多個節(jié)點,每個節(jié)點包括存儲單元;以及互連,其連接多個節(jié)點,其中多個節(jié)點中的至少一個節(jié)點包括:異常檢測單元,其使用能夠在一個節(jié)點和另一節(jié)點中共享的、設(shè)置在一個節(jié)點或另一節(jié)點中的存儲單元中所包括的共享存儲器區(qū)域來檢測數(shù)據(jù)傳送的數(shù)據(jù)傳送路徑中的異常,或者使用能夠在一個節(jié)點和另一節(jié)點中共享的、設(shè)置在一個節(jié)點或另一節(jié)點中的存儲單元中所包括的共享存儲器區(qū)域來檢測數(shù)據(jù)傳送的數(shù)據(jù)傳送路徑中包括的特定節(jié)點中的異常;錯誤信息生成單元,其基于由異常檢測單元檢測到的異常來生成錯誤信息,并且生成針對自身節(jié)點中的處理器的中斷;以及處理器,其根據(jù)中斷基于錯誤信息來執(zhí)行恢復(fù)處理。
附圖說明
圖1是描述根據(jù)第一實施例的信息處理系統(tǒng)的示例的示圖;
圖2是描述根據(jù)第一實施例的構(gòu)造塊的功能配置的示圖;
圖3是描述當其他節(jié)點附連到被分配共享存儲器的節(jié)點時的存儲器圖的示例的示圖;
圖4是描述根據(jù)第一實施例的CPU的功能配置的示圖;
圖5是描述根據(jù)第一實施例的節(jié)點圖的數(shù)據(jù)格式的示例的示圖;
圖6是描述目錄的數(shù)據(jù)格式的示例的示圖;
圖7是描述由根據(jù)第一實施例的CPU傳送的分組的示圖;
圖8是圖示傳送分組的示例的示圖;
圖9是圖示異常檢測單元的另一配置的示例的示圖;
圖10是圖示“TLP報頭”的數(shù)據(jù)格式的示例的示圖;
圖11是描述接收“中毒TLP”分組的PCIe控制單元的操作的具體示例的示圖;
圖12是描述根據(jù)第一實施例的使CPU傳送請求的處理的示例的示圖;
圖13是描述根據(jù)第一實施例的當CPU接收分組時執(zhí)行的處理的示例的示圖;
圖14是描述根據(jù)第一實施例的使I/O設(shè)備傳送請求的處理的示例的示圖;
圖15是描述根據(jù)第一實施例的使I/O設(shè)備接收響應(yīng)的處理的示例的示圖;
圖16是描述當在節(jié)點和包括相應(yīng)節(jié)點的訪問對象的存儲器的節(jié)點之間發(fā)生數(shù)據(jù)傳送異常時執(zhí)行的處理的示例的示圖;
圖17是描述當在節(jié)點和包括相應(yīng)節(jié)點的訪問對象的存儲器的節(jié)點之間發(fā)生數(shù)據(jù)傳送異常時執(zhí)行的處理的示例的示圖;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于富士通株式會社,未經(jīng)富士通株式會社許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210425451.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字數(shù)據(jù)處理
G06F15-00 通用數(shù)字計算機
G06F15-02 .通過鍵盤輸入的手動操作,以及應(yīng)用機內(nèi)程序的計算,例如,袖珍計算器
G06F15-04 .在引入被處理的數(shù)據(jù)的同時,進行編制程序的,例如,在同一記錄載體上
G06F15-08 .應(yīng)用插接板編制程序的
G06F15-16 .兩個或多個數(shù)字計算機的組合,其中每臺至少具有一個運算器、一個程序器及一個寄存器,例如,用于數(shù)個程序的同時處理
G06F15-18 .其中,根據(jù)計算機本身在一個完整的運行期間內(nèi)所取得的經(jīng)驗來改變程序的;學(xué)習(xí)機器





