[發(fā)明專利]應(yīng)用于云聯(lián)邦的人工智能池化算法調(diào)度與管理方法及裝置在審
| 申請(qǐng)?zhí)枺?/td> | 202110015006.6 | 申請(qǐng)日: | 2021-01-06 |
| 公開(kāi)(公告)號(hào): | CN112783645A | 公開(kāi)(公告)日: | 2021-05-11 |
| 發(fā)明(設(shè)計(jì))人: | 程家明;孔繁東;周志祥;彭偉 | 申請(qǐng)(專利權(quán))人: | 武漢興圖新科電子股份有限公司 |
| 主分類號(hào): | G06F9/50 | 分類號(hào): | G06F9/50 |
| 代理公司: | 武漢知產(chǎn)時(shí)代知識(shí)產(chǎn)權(quán)代理有限公司 42238 | 代理人: | 張毅 |
| 地址: | 430000 湖北省武漢市東湖新*** | 國(guó)省代碼: | 湖北;42 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 應(yīng)用于 聯(lián)邦 人工智能 算法 調(diào)度 管理 方法 裝置 | ||
本發(fā)明涉及人工智能服務(wù)應(yīng)用領(lǐng)域,提出一種應(yīng)用于云聯(lián)邦的人工智能池化算法調(diào)度與管理方法,其特征在于,包括步驟:獲取算法池,向所述算法池中調(diào)入算法實(shí)例;根據(jù)算法調(diào)度請(qǐng)求,在所述算法池的算法實(shí)例中,調(diào)出與所述算法調(diào)度請(qǐng)求對(duì)應(yīng)的目標(biāo)算法實(shí)例。本發(fā)明解決靜態(tài)資源分配導(dǎo)致的部署靈活性差、資源利用率低的問(wèn)題;解決了傳統(tǒng)GPU虛擬化技術(shù)的復(fù)雜性和規(guī)模問(wèn)題;在滿足同等資源條件以及保證服務(wù)可用的前提下,盡可能發(fā)揮資源的最大能效。
技術(shù)領(lǐng)域
本發(fā)明涉及人工智能服務(wù)應(yīng)用領(lǐng)域,尤其涉及一種應(yīng)用于云聯(lián)邦的人工智能池化算法調(diào)度與管理方法及裝置。
背景技術(shù)
現(xiàn)有技術(shù)中,90%以上的人工智能應(yīng)用都運(yùn)行在GPU上,而且GPU價(jià)格昂貴。當(dāng)模型訓(xùn)練完成,在實(shí)際場(chǎng)景進(jìn)行部署的時(shí)候,GPU通常采用靜態(tài)分配。每個(gè)算法都需要固定大小的顯存,一個(gè)業(yè)務(wù)場(chǎng)景需要多個(gè)算法和檢測(cè)規(guī)則,算法模型在啟動(dòng)實(shí)例化的時(shí)候也比較的耗時(shí),所以,一般在算法部署的時(shí)候,就根據(jù)GPU顯存大小、算法類型和算法個(gè)數(shù)提前分配好GPU資源。實(shí)際應(yīng)用場(chǎng)景中,由于每個(gè)算法工作的時(shí)長(zhǎng),以及每個(gè)算法的檢測(cè)速度都不一樣,現(xiàn)有技術(shù)的資源預(yù)分配,存在算法模型部署靈活性差,資源利用率低,極大的造成了資源浪費(fèi)的技術(shù)問(wèn)題。
上述內(nèi)容僅用于輔助理解本發(fā)明的技術(shù)方案,并不代表承認(rèn)上述內(nèi)容是現(xiàn)有技術(shù)。
發(fā)明內(nèi)容
本發(fā)明的主要目的在于,解決現(xiàn)有技術(shù)的資源預(yù)分配,存在算法模型部署靈活性差,資源利用率低,極大的造成了資源浪費(fèi)的技術(shù)問(wèn)題。
為實(shí)現(xiàn)上述目的,本發(fā)明提供應(yīng)用于云聯(lián)邦的人工智能池化算法調(diào)度與管理方法,包括以下步驟:
S1:獲取算法池,向所述算法池中調(diào)入算法實(shí)例;
S2:根據(jù)算法調(diào)度請(qǐng)求,在所述算法池的算法實(shí)例中,調(diào)出與所述算法調(diào)度請(qǐng)求對(duì)應(yīng)的目標(biāo)算法實(shí)例。
優(yōu)選地,步驟S1具體為:
S11:獲取算法池,配置所述算法池的算法實(shí)例最小數(shù)量;
S12:檢測(cè)所述算法池是否為空,若是,則根據(jù)所述算法實(shí)例最小數(shù)量,向所述算法池中調(diào)入對(duì)應(yīng)數(shù)量的算法對(duì)象,進(jìn)入步驟S13;否則進(jìn)入步驟S2;
S13:將各所述算法對(duì)象進(jìn)行實(shí)例化處理,獲得對(duì)應(yīng)的算法實(shí)例。
優(yōu)選地,步驟S2具體為:
S21:接收到算法調(diào)度請(qǐng)求后,檢測(cè)所述算法池中是否存在與所述算法調(diào)度請(qǐng)求對(duì)應(yīng)的目標(biāo)算法實(shí)例;
S22:若存在,則將所述目標(biāo)算法實(shí)例調(diào)出所述算法池,進(jìn)入步驟S23;否則進(jìn)入步驟S24;
S23:檢測(cè)所述算法調(diào)度請(qǐng)求的每秒請(qǐng)求數(shù);若所述每秒請(qǐng)求數(shù)大于或等于閾值,且所述算法池中算法實(shí)例的當(dāng)前數(shù)量沒(méi)有達(dá)到最大值,則向所述算法池中添加新的算法實(shí)例,返回步驟S21;否則不進(jìn)行任何操作,返回步驟S21;
S24:進(jìn)入等待隊(duì)列,等待時(shí)間t開(kāi)始計(jì)時(shí);若所述等待時(shí)間t小于或等于預(yù)設(shè)值,且收到算法實(shí)例釋放信號(hào),則返回步驟S21;若所述等待時(shí)間t大于預(yù)設(shè)值,或收到結(jié)束命令,則請(qǐng)求進(jìn)行超時(shí)處理,并返回步驟S21。
優(yōu)選地,每隔預(yù)設(shè)時(shí)間T進(jìn)行一次步驟S3;
S3:檢測(cè)所述算法池中各所述算法實(shí)例的存活時(shí)間,根據(jù)所述存活時(shí)間釋放空閑的算法實(shí)例。
優(yōu)選地,步驟S3具體為:
S31:檢測(cè)各所述算法實(shí)例的存活時(shí)間;若存在所述存活時(shí)間大于或等于空閑時(shí)間的算法實(shí)例,則將所述存活時(shí)間大于或等于空閑時(shí)間的算法實(shí)例標(biāo)記為空閑的算法實(shí)例,進(jìn)入步驟S32;否則結(jié)束步驟S3;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于武漢興圖新科電子股份有限公司,未經(jīng)武漢興圖新科電子股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110015006.6/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 一種Agent聯(lián)邦快速設(shè)計(jì)流程建模方法
- 基于聯(lián)邦模式的動(dòng)態(tài)產(chǎn)品協(xié)同開(kāi)發(fā)平臺(tái)及方法
- 一種面向深空通信的數(shù)據(jù)傳輸速率控制方法
- 一種HLA聯(lián)邦成員的動(dòng)態(tài)部署分配方法
- 聯(lián)邦學(xué)習(xí)方法、系統(tǒng)、終端設(shè)備及存儲(chǔ)介質(zhì)
- 一種混合聯(lián)邦學(xué)習(xí)方法及架構(gòu)
- 聯(lián)邦學(xué)習(xí)的沙盒機(jī)制
- 聯(lián)邦模型參數(shù)確定方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種應(yīng)用于異構(gòu)計(jì)算設(shè)備的聯(lián)邦學(xué)習(xí)系統(tǒng)和方法
- 基于區(qū)塊鏈的聯(lián)邦建模方法及裝置
- 使用基于云端的度量迭代訓(xùn)練人工智能的系統(tǒng)
- 一種人工智能轉(zhuǎn)人工智能再轉(zhuǎn)人工方案
- O-RAN系統(tǒng)中的人工智能模型處理方法和裝置
- 人工智能傷口評(píng)估方法及智能終端
- 人工智能倫理風(fēng)險(xiǎn)與防范虛擬仿真方法、系統(tǒng)和機(jī)器人
- 一種基于人工智能基礎(chǔ)資源與技術(shù)調(diào)控系統(tǒng)及方法
- 基于人工智能倫理備選規(guī)則的人工智能倫理風(fēng)險(xiǎn)防范方法
- 人工智能倫理風(fēng)險(xiǎn)辨識(shí)防范虛擬仿真實(shí)驗(yàn)方法和機(jī)器人
- 基于人工智能體決策的人工智能倫理風(fēng)險(xiǎn)辨識(shí)和防范方法
- 基于算法選擇的人工智能倫理風(fēng)險(xiǎn)辨識(shí)防范方法和機(jī)器人





