[發(fā)明專利]一種GPU掉卡模擬方法、系統(tǒng)、終端及存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 201911331523.3 | 申請日: | 2019-12-21 |
| 公開(公告)號: | CN111176924B | 公開(公告)日: | 2022-07-22 |
| 發(fā)明(設(shè)計)人: | 馬磊 | 申請(專利權(quán))人: | 蘇州浪潮智能科技有限公司 |
| 主分類號: | G06F11/26 | 分類號: | G06F11/26;G06F9/4401;G06F9/445 |
| 代理公司: | 濟南舜源專利事務(wù)所有限公司 37205 | 代理人: | 李舜江 |
| 地址: | 215100 江蘇省蘇州市吳*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 gpu 模擬 方法 系統(tǒng) 終端 存儲 介質(zhì) | ||
1.一種GPU掉卡模擬方法,其特征在于,包括:
卸載GPU卡的驅(qū)動軟件;
查找GPU配置文件;
按GPU卡硬件信息格式設(shè)置虛假硬件信息;
判斷主機是否存在空閑GPU卡槽:
若是,則將所述虛假硬件信息寫入GPU配置文件。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括:
在主機GPU掉卡模擬成功狀態(tài)下,重啟主機;
利用驅(qū)動安裝腳本調(diào)用實際GPU卡匹配驅(qū)動進(jìn)行驅(qū)動安裝;
重啟主機將主機從GPU掉卡狀態(tài)恢復(fù)至正常狀態(tài)。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述按GPU卡硬件信息格式設(shè)置虛假硬件信息,包括:
通過lspci命令查找GPU卡的真實硬件信息;
抓取所述真實硬件信息作為生成虛假硬件信息的基礎(chǔ)信息;
將所述基礎(chǔ)信息中的GPU身份參數(shù)值修改為預(yù)設(shè)值,所述預(yù)設(shè)值為隨機數(shù)且所述預(yù)設(shè)值與配置文件中的真實硬件信息GPU身份參數(shù)值不同,將修改后的基礎(chǔ)信息作為虛假硬件信息輸出。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述判斷主機是否存在空閑GPU卡槽,包括:
采集主機GPU卡槽數(shù)量;
采集所述GPU配置文件中的真實GPU卡配置信息數(shù)量;
判斷所述GPU卡槽數(shù)量是否超過所述真實GPU卡配置信息數(shù)量:
若是,則判定主機存在空閑GPU卡槽。
5.一種GPU掉卡模擬系統(tǒng),其特征在于,包括:
驅(qū)動卸載單元,配置用于卸載GPU卡的驅(qū)動軟件;
文件查找單元,配置用于查找GPU配置文件;
模擬設(shè)置單元,配置用于按GPU卡硬件信息格式設(shè)置虛假硬件信息;
卡槽確認(rèn)單元,配置用于判斷主機是否存在空閑GPU卡槽;
模擬注入單元,配置用于若主機存在空閑GPU卡槽,則將所述虛假硬件信息寫入GPU配置文件。
6.根據(jù)權(quán)利要求5所述的系統(tǒng),其特征在于,所述系統(tǒng)還包括:
第一重啟單元,配置用于在主機GPU掉卡模擬成功狀態(tài)下,重啟主機;
驅(qū)動安裝單元,配置用于利用驅(qū)動安裝腳本調(diào)用實際GPU卡匹配驅(qū)動進(jìn)行驅(qū)動安裝;
第二重啟單元,配置用于重啟主機將主機從GPU掉卡狀態(tài)恢復(fù)至正常狀態(tài)。
7.根據(jù)權(quán)利要求5所述的系統(tǒng),其特征在于,所述模擬設(shè)置單元包括:
信息查找模塊,配置用于通過lspci命令查找GPU卡的真實硬件信息;
信息采集模塊,配置用于抓取所述真實硬件信息作為生成虛假硬件信息的基礎(chǔ)信息;
信息修改模塊,配置用于將所述基礎(chǔ)信息中的GPU身份參數(shù)值修改為預(yù)設(shè)值,所述預(yù)設(shè)值為隨機數(shù)且所述預(yù)設(shè)值與配置文件中的真實硬件信息GPU身份參數(shù)值不同,將修改后的基礎(chǔ)信息作為虛假硬件信息輸出。
8.根據(jù)權(quán)利要求5所述的系統(tǒng),其特征在于,所述卡槽確認(rèn)單元包括:
第一采集模塊,配置用于采集主機GPU卡槽數(shù)量;
第二采集模塊,配置用于采集所述GPU配置文件中的真實GPU卡配置信息數(shù)量;
數(shù)量比對模塊,配置用于判斷所述GPU卡槽數(shù)量是否超過所述真實GPU卡配置信息數(shù)量:
空閑判定模塊,配置用于若所述GPU卡槽數(shù)量超過所述真實GPU卡配置信息數(shù)量,則判定主機存在空閑GPU卡槽。
9.一種終端,其特征在于,包括:
處理器;
用于存儲處理器的執(zhí)行指令的存儲器;
其中,所述處理器被配置為執(zhí)行權(quán)利要求1-4任一項所述的方法。
10.一種存儲有計算機程序的計算機可讀存儲介質(zhì),其特征在于,該程序被處理器執(zhí)行時實現(xiàn)如權(quán)利要求1-4中任一項所述的方法。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于蘇州浪潮智能科技有限公司,未經(jīng)蘇州浪潮智能科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911331523.3/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 圖形處理器任務(wù)的分配方法和裝置
- 一種資源調(diào)度裝置、資源調(diào)度系統(tǒng)和資源調(diào)度方法
- 一種免工具GPU支架固定裝置
- 一種YARN集群GPU資源調(diào)度方法、裝置和介質(zhì)
- 一種服務(wù)器內(nèi)4GPU布局結(jié)構(gòu)及其安裝方法
- 一種GPU資源調(diào)度系統(tǒng)及其調(diào)度方法
- 一種GPU拓?fù)浞謪^(qū)方法與裝置
- 一種基于Kubernetes的共享GPU調(diào)度方法
- 一種數(shù)據(jù)處理的方法和裝置
- 一種GPU分配方法、系統(tǒng)、存儲介質(zhì)及設(shè)備





