[發明專利]信息處理設備、信息處理系統及非暫態存儲介質在審
| 申請號: | 202010826110.9 | 申請日: | 2020-08-17 |
| 公開(公告)號: | CN112540878A | 公開(公告)日: | 2021-03-23 |
| 發明(設計)人: | 井原宣孝;川島崇裕 | 申請(專利權)人: | 富士通株式會社 |
| 主分類號: | G06F11/20 | 分類號: | G06F11/20 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 陳煒;李德山 |
| 地址: | 日本神*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 信息處理 設備 系統 非暫態 存儲 介質 | ||
一個實施方式提供了一種信息處理設備,該信息處理設備有效地與其他信息處理設備協同執行并行任務。在示例中,信息處理設備包括:存儲器,其被配置成存儲計算機可讀指令;以及處理器,其被配置成執行存儲器中存儲的計算機可讀指令,該計算機可讀指令包括:提供發布錯誤信息的屏障通信的指令;以及基于用于屏障通信的指令,向其他信息處理設備中的每一個傳播錯誤信息。
技術領域
本文中論述的實施方式涉及信息處理設備、信息處理系統以及存儲通信管理程序的非暫態計算機可讀存儲介質。
背景技術
在高性能計算(HPC)等中的并行程序中,通信庫(例如,消息傳遞接口(MPI)庫)被用于在節點之間發送和接收數據的許多情況中。
在HPC等中,當需要輸入具有高優先級的任務時,通過暫時停止具有低優先級的任務并且保存所需信息來釋放節點資源,并且在執行了具有優先級高的任務之后恢復所保存的信息。然后,已經使用了用于從使暫時停止的任務停止的處理中重啟任務的技術,并且已經開發了諸如任務遷移、任務凍結和任務交換的功能。
在使用不包括屏障通信的節點間數據通信暫時停止任務的處理開始時,已經執行通信的庫(例如,通信庫(例如,MPI))存儲關于每個處理的信息。因此,可以唯一地確定處理的重啟位置,而不管其他節點的狀態。在屏障通信使用硬件功能時,通知每個處理的狀態并且確定每個處理的狀態,使得可以確定任務的重啟位置。
相關技術的示例包括日本特開專利公布No.04-223533和日本特開專利公布No.2004-227188。
發明內容
[技術問題]
然而,在任務交換期間停止屏障通信之后,如果在軟件級別上處理的狀態未被彼此識別,則由于換出使得任務的暫時停止可能不會被處理,并且換入后的任務的重啟位置可能無法確定。
在一個方面,目的是高速地停止屏障通信。
[問題的解決方案]
在一個方面,執行并行任務的多個信息處理設備中的信息處理設備包括:指令單元,其給出發布錯誤信息的屏障通信的指令;處理單元,其基于來自指令單元的用于屏障通信的指令,向其他信息處理設備中的每一個傳播錯誤信息。
[本發明的有益效果]
在一個方面,可以高速地停止屏障通信。
本發明的目的和優點將借助于權利要求書中特別指出的要素和組合來實現和獲得。
應該理解的是,前面的總體描述和后面的詳細描述兩者均為示例性和說明性的,而不是對本發明進行限制。
附圖說明
圖1是示出作為實施方式的示例的信息處理系統的配置示例的框圖;
圖2是示意性示出圖1所示的資源管理節點的功能配置示例的框圖;
圖3是示意性地示出圖1所示的計算節點的功能配置示例的框圖;
圖4示出了根據相關示例的在屏障網絡中的所有處理中完成屏障通信的示例;
圖5是示出根據相關示例的在屏障網絡中重啟屏障通信的處理的圖;
圖6示出了根據相關示例的未在屏障網絡中的所有處理中完成屏障通信的示例;
圖7示出了其中由于出現錯誤而使屏障通信在圖1所示的信息處理系統中的屏障網絡中的所有處理中完成的示例;
圖8是示出在圖1所示的信息處理系統中的屏障網絡中出現錯誤之后重啟屏障通信的處理的圖;
圖9是示出在圖1所示的信息處理系統中的屏障網絡中未出現錯誤時重啟屏障通信的處理的圖;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于富士通株式會社,未經富士通株式會社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010826110.9/2.html,轉載請聲明來源鉆瓜專利網。





