[發(fā)明專利]一種AI平臺(tái)鏡像處理的方法和裝置有效
| 申請(qǐng)?zhí)枺?/td> | 202010955468.1 | 申請(qǐng)日: | 2020-09-11 |
| 公開(公告)號(hào): | CN112130869B | 公開(公告)日: | 2022-11-29 |
| 發(fā)明(設(shè)計(jì))人: | 王繼玉 | 申請(qǐng)(專利權(quán))人: | 蘇州浪潮智能科技有限公司 |
| 主分類號(hào): | G06F8/61 | 分類號(hào): | G06F8/61;G06F11/30;G06F9/50 |
| 代理公司: | 北京連和連知識(shí)產(chǎn)權(quán)代理有限公司 11278 | 代理人: | 陳黎明;楊帆 |
| 地址: | 215100 江蘇省蘇州市吳*** | 國(guó)省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 ai 平臺(tái) 處理 方法 裝置 | ||
本發(fā)明公開了一種AI平臺(tái)鏡像處理的方法,包括:響應(yīng)于接收到制作鏡像的請(qǐng)求,掃描制作鏡像的文件以檢測(cè)文件的語(yǔ)法和格式是否正確,響應(yīng)于檢測(cè)文件的語(yǔ)法和格式正確,根據(jù)文件制作鏡像;響應(yīng)于接收到向訓(xùn)練平臺(tái)導(dǎo)入鏡像的請(qǐng)求,根據(jù)鏡像的鏡像類型以及組件信息選擇并安裝鏡像訓(xùn)練所需的組件;根據(jù)鏡像的優(yōu)先級(jí)調(diào)整待導(dǎo)入的鏡像的排隊(duì)位置,根據(jù)排隊(duì)位置導(dǎo)入鏡像;響應(yīng)于接收到模型訓(xùn)練的請(qǐng)求,根據(jù)鏡像信息和訓(xùn)練任務(wù)信息分類并推薦鏡像,并根據(jù)選擇的鏡像訓(xùn)練模型;響應(yīng)于檢測(cè)到鏡像在本地磁盤空間的存儲(chǔ)達(dá)到預(yù)設(shè)清理閾值,根據(jù)鏡像的使用信息篩選并清理篩選出的鏡像。本發(fā)明還公開了一種相應(yīng)的裝置。本發(fā)明可以提升AI平臺(tái)的穩(wěn)定性和可靠性。
技術(shù)領(lǐng)域
本發(fā)明涉及計(jì)算機(jī)技術(shù)領(lǐng)域,更具體地,特別是指一種AI平臺(tái)鏡像處理的方法和裝置。
背景技術(shù)
現(xiàn)階段,AI訓(xùn)練平臺(tái),都是基于鏡像,在容器中訓(xùn)練模型,如果是分布式任務(wù),需要多個(gè)容器同時(shí)進(jìn)行訓(xùn)練,這些容器可能在一臺(tái)或者多臺(tái)服務(wù)器上。同時(shí),AI平臺(tái)基本都是微服務(wù),支持容器化部署,并且支持K8S的調(diào)度和管理,具備容錯(cuò)能力,如果服務(wù)的鏡像和鏡像倉(cāng)庫(kù)出現(xiàn)問(wèn)題,運(yùn)行各個(gè)服務(wù)的容器,都可能受到影響,導(dǎo)致AI平臺(tái)的功能出現(xiàn)問(wèn)題,所以,對(duì)AI平臺(tái)的鏡像、以及鏡像倉(cāng)庫(kù)的管理和維護(hù)至關(guān)重要。
現(xiàn)階段,進(jìn)行模型訓(xùn)練,需要安裝不同深度學(xué)習(xí)框架的鏡像,大型的AI平臺(tái)可能擁有幾十到上百個(gè)不同類型的鏡像,對(duì)鏡像的分類、檢索、更新、數(shù)據(jù)遷移和備份,以及組件的升級(jí)維護(hù),都需要花費(fèi)大量的時(shí)間和精力。
針對(duì)高并發(fā),分布式訓(xùn)練任務(wù),需要在計(jì)算節(jié)點(diǎn)同時(shí)拉取多個(gè)鏡像,高強(qiáng)度,高并發(fā)的鏡像操作,需要鏡像倉(cāng)庫(kù)具備更高的穩(wěn)定性、可靠性以及容錯(cuò)能力。部署高可用的harbor鏡像倉(cāng)庫(kù),以及監(jiān)控harbor倉(cāng)庫(kù)的健康狀態(tài),處理harbor倉(cāng)庫(kù)的各種異常,及時(shí)恢復(fù)harbor倉(cāng)庫(kù)的服務(wù),需要AI平臺(tái)具備良好的鏡像處理策略和方法。
同時(shí)AI平臺(tái)會(huì)根據(jù)訓(xùn)練需要,導(dǎo)入或者制作不同的鏡像到AI平臺(tái),深度學(xué)習(xí)鏡像,一般都是上G大小,導(dǎo)入和制作都需要花費(fèi)一定時(shí)間。對(duì)于多用戶高并發(fā)的導(dǎo)入和制作鏡像,需要鏡像處理模塊,具備高并發(fā)能力,以及優(yōu)先處理能力,為了提升用戶體驗(yàn),高并發(fā)場(chǎng)景,還需要具備排隊(duì)位置顯示,以及制作剩余時(shí)間顯示的功能,同時(shí)提供進(jìn)度顯示,實(shí)時(shí)日志顯示制作過(guò)程等功能。讓AI平臺(tái)的鏡像管理具備高性能的同時(shí),也具備易用性。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明實(shí)施例的目的在于提供一種使用鏡像進(jìn)行模型訓(xùn)練的AI平臺(tái),能夠?qū)Ψ?wù)鏡像、深度學(xué)習(xí)等鏡像進(jìn)行處理,實(shí)現(xiàn)AI平臺(tái)鏡像的準(zhǔn)確化和精細(xì)化管理,提升AI平臺(tái)的穩(wěn)定性和健壯性。實(shí)現(xiàn)Dockerfile文件語(yǔ)法檢查,語(yǔ)法命令錯(cuò)誤提示,格式錯(cuò)誤提示等;實(shí)現(xiàn)高并發(fā)制作和導(dǎo)入鏡像,可以根據(jù)docker服務(wù)器CPU、內(nèi)存資源利用率,調(diào)整并發(fā)數(shù)量,同時(shí)可以根據(jù)優(yōu)先級(jí),調(diào)整操作的鏡像,實(shí)時(shí)顯示操作的鏡像進(jìn)度、排隊(duì)位置和日志信息,支持刪除排隊(duì)狀態(tài)的任務(wù),及時(shí)終止不想制作和導(dǎo)入的鏡像。制作和導(dǎo)入鏡像的過(guò)程中,會(huì)自動(dòng)安裝推薦或手動(dòng)選擇的組件,比如jupyter,opencv,python等組件,保證導(dǎo)入的鏡像,能夠在AI平臺(tái)進(jìn)行模型訓(xùn)練。根據(jù)鏡像管理策略和方法對(duì)AI訓(xùn)練平臺(tái)的鏡像進(jìn)行多元化管理和維護(hù),提升AI平臺(tái)的穩(wěn)定性和可靠性。
基于上述目的,本發(fā)明一方面提供了一種AI平臺(tái)鏡像處理的方法,該方法包括:
響應(yīng)于接收到制作鏡像的請(qǐng)求,掃描制作鏡像的文件以檢測(cè)文件的語(yǔ)法和格式是否正確,響應(yīng)于檢測(cè)文件的語(yǔ)法和格式正確,根據(jù)文件制作鏡像;
響應(yīng)于接收到向訓(xùn)練平臺(tái)導(dǎo)入鏡像的請(qǐng)求,根據(jù)鏡像的鏡像類型以及組件信息選擇并安裝鏡像訓(xùn)練所需的組件;
根據(jù)鏡像的優(yōu)先級(jí)調(diào)整待導(dǎo)入的鏡像的排隊(duì)位置,根據(jù)排隊(duì)位置導(dǎo)入鏡像;
響應(yīng)于接收到模型訓(xùn)練的請(qǐng)求,根據(jù)鏡像信息和訓(xùn)練任務(wù)信息分類并推薦鏡像,并根據(jù)選擇的鏡像訓(xùn)練模型;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于蘇州浪潮智能科技有限公司,未經(jīng)蘇州浪潮智能科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010955468.1/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- AI接口平臺(tái)及其應(yīng)用方法、AI應(yīng)用系統(tǒng)
- AI行為調(diào)用方法和裝置
- 人工智能平臺(tái)實(shí)現(xiàn)方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 人工智能的病種分析方法及裝置、存儲(chǔ)介質(zhì)、計(jì)算機(jī)設(shè)備
- 一種處理AI任務(wù)的方法及裝置
- 提供AI模型的方法、AI平臺(tái)、計(jì)算設(shè)備及存儲(chǔ)介質(zhì)
- 一種自適應(yīng)AI模型部署方法
- 分離AI中的公共知識(shí)與私有知識(shí)
- 應(yīng)用于城市大腦的AI算法和AI模型的調(diào)配系統(tǒng)及方法
- 云服務(wù)方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種數(shù)據(jù)庫(kù)讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





