[發(fā)明專利]一種基于機(jī)器學(xué)習(xí)的顯卡任務(wù)資源的調(diào)度方法及系統(tǒng)有效
| 申請(qǐng)?zhí)枺?/td> | 202310060601.0 | 申請(qǐng)日: | 2023-01-18 |
| 公開(公告)號(hào): | CN115827206B | 公開(公告)日: | 2023-05-05 |
| 發(fā)明(設(shè)計(jì))人: | 魯定一;傅豪;郭兆龍;董錦芝;劉銳;付文杰;李奕飛 | 申請(qǐng)(專利權(quán))人: | 太極計(jì)算機(jī)股份有限公司 |
| 主分類號(hào): | G06F9/48 | 分類號(hào): | G06F9/48;G06F9/50;G06N20/00 |
| 代理公司: | 北京睿博行遠(yuǎn)知識(shí)產(chǎn)權(quán)代理有限公司 11297 | 代理人: | 楊麗娟 |
| 地址: | 100089 北*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 機(jī)器 學(xué)習(xí) 顯卡 任務(wù) 資源 調(diào)度 方法 系統(tǒng) | ||
1.一種基于機(jī)器學(xué)習(xí)的顯卡任務(wù)資源的調(diào)度方法,其特征在于,包括:
步驟1:確定同時(shí)刻在線的顯卡數(shù)量以及針對(duì)每個(gè)在線顯卡的請(qǐng)求數(shù)量,同時(shí),確定每個(gè)在線顯卡的資源集以及與在線顯卡匹配的資源集中每個(gè)資源的任務(wù)響應(yīng)時(shí)間;
步驟2:基于機(jī)器學(xué)習(xí)模型分析多個(gè)在線顯卡在同時(shí)刻的請(qǐng)求數(shù)量、資源集以及任務(wù)響應(yīng)時(shí)間,輸出所述多個(gè)在線顯卡的沖突事件;
步驟3:從除所述多個(gè)在線顯卡外的剩余顯卡中獲取基于所述沖突事件的可調(diào)度單元,并基于所述可調(diào)度單元進(jìn)行沖突任務(wù)的分配,實(shí)現(xiàn)顯卡資源調(diào)度;
其中,基于機(jī)器學(xué)習(xí)模型分析多個(gè)在線顯卡在同時(shí)刻的請(qǐng)求數(shù)量、資源集以及任務(wù)響應(yīng)時(shí)間,輸出所述多個(gè)在線顯卡的沖突事件,包括:
確定同時(shí)刻下多個(gè)在線顯卡的請(qǐng)求數(shù)量是否存在數(shù)量擁擠;
若存在,則獲取多余請(qǐng)求,并作為第一沖突事件輸出;
確定多個(gè)在線顯卡的每個(gè)請(qǐng)求的請(qǐng)求資源類型以及請(qǐng)求占用資源;
當(dāng)基于多個(gè)在線顯卡下的同時(shí)刻的請(qǐng)求資源類型中的同類型請(qǐng)求的總數(shù)量超出類型數(shù)量上限時(shí),作為第二沖突事件輸出;
判斷請(qǐng)求占用資源的資源條目是否超出上限資源集的空閑占用條目;
若超出,作為第三沖突事件輸出;
確定多個(gè)在線顯卡的每個(gè)請(qǐng)求的當(dāng)下排隊(duì)響應(yīng)時(shí)間點(diǎn)以及當(dāng)下排隊(duì)響應(yīng)時(shí)間點(diǎn)與對(duì)應(yīng)任務(wù)響應(yīng)時(shí)間的時(shí)間差異,作為第四沖突事件輸出。
2.如權(quán)利要求1所述的基于機(jī)器學(xué)習(xí)的顯卡任務(wù)資源的調(diào)度方法,其特征在于,確定同時(shí)刻在線的顯卡數(shù)量以及針對(duì)每個(gè)在線顯卡的請(qǐng)求數(shù)量,包括:
獲取針對(duì)多個(gè)在線顯卡在同時(shí)刻下的請(qǐng)求表;
統(tǒng)計(jì)所述請(qǐng)求表中的請(qǐng)求數(shù)量。
3.如權(quán)利要求1所述的基于機(jī)器學(xué)習(xí)的顯卡任務(wù)資源的調(diào)度方法,其特征在于,確定每個(gè)在線顯卡的資源集以及與在線顯卡匹配的資源集中每個(gè)資源的任務(wù)響應(yīng)時(shí)間,包括:
確定每個(gè)在線顯卡的當(dāng)前已有資源、預(yù)約傳輸資源、剩余可保存資源,其中,所述當(dāng)前已有資源、預(yù)約傳輸資源、剩余可保存資源即為資源集;
分析每個(gè)在線顯卡的顯卡類型,并從歷史數(shù)據(jù)庫(kù)中調(diào)取與所述顯卡類型匹配的資源分配情況;
對(duì)所述資源分配情況進(jìn)行分配切分,得到針對(duì)不同資源的任務(wù)響應(yīng)時(shí)間。
4.如權(quán)利要求3所述的基于機(jī)器學(xué)習(xí)的顯卡任務(wù)資源的調(diào)度方法,其特征在于,對(duì)所述資源分配情況進(jìn)行分配切分,得到針對(duì)不同資源的任務(wù)響應(yīng)時(shí)間,包括:
對(duì)所述資源分配情況進(jìn)行時(shí)間點(diǎn)分配,構(gòu)建歷史時(shí)刻分配表,其中,所述歷史時(shí)刻分配表包括不同歷史時(shí)刻下的歷史分配資源;
根據(jù)所述歷史時(shí)刻分配表,建立歷史分配數(shù)組;
對(duì)所述歷史分配數(shù)組進(jìn)行同類型資源分配,得到歷史分配序列,并得到針對(duì)同類型資源的第一響應(yīng)時(shí)間;
確定同類型資源的歷史先后出現(xiàn)時(shí)間順序與在線顯卡匹配的資源集中的當(dāng)前已有資源以及預(yù)約傳輸資源的先后出現(xiàn)時(shí)間順序之間的匹配映射關(guān)系;
根據(jù)與所述當(dāng)前已有資源、預(yù)約傳輸資源以及剩余可保存資源所匹配的資源類型的第一響應(yīng)時(shí)間,且結(jié)合匹配映射關(guān)系,得到針對(duì)不同資源的任務(wù)響應(yīng)時(shí)間。
5.如權(quán)利要求1所述的基于機(jī)器學(xué)習(xí)的顯卡任務(wù)資源的調(diào)度方法,其特征在于,獲取基于所述沖突事件的可調(diào)度單元,并基于所述可調(diào)度單元進(jìn)行沖突任務(wù)的分配,實(shí)現(xiàn)顯卡資源調(diào)度,包括:
獲取針對(duì)每個(gè)在線顯卡的沖突集合;
根據(jù)所述沖突集合所包含的沖突類型,向?qū)?yīng)在線顯卡設(shè)置沖突緩解權(quán)重;
對(duì)所設(shè)置的沖突緩解權(quán)重進(jìn)行大小排序,并當(dāng)存在一致權(quán)重時(shí),分析獲取每個(gè)一致權(quán)重所對(duì)應(yīng)沖突事件的產(chǎn)生時(shí)間,并進(jìn)行時(shí)間累計(jì)計(jì)算,對(duì)一致權(quán)重進(jìn)行再次大小排序;
根據(jù)再次大小排序結(jié)果,得到最終權(quán)重順序,并作為對(duì)應(yīng)在線顯卡的調(diào)度順序,且結(jié)合所述沖突集合匹配的可調(diào)度單元,實(shí)現(xiàn)對(duì)多個(gè)在線顯卡的沖突任務(wù)的分配,實(shí)現(xiàn)顯卡資源調(diào)度。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于太極計(jì)算機(jī)股份有限公司,未經(jīng)太極計(jì)算機(jī)股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310060601.0/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 根據(jù)用戶學(xué)習(xí)效果動(dòng)態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個(gè)人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動(dòng)學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 游戲?qū)W習(xí)效果評(píng)測(cè)方法及系統(tǒng)





