[發(fā)明專利]基于Kubernetes的自動化模型訓(xùn)練方法和裝置在審
| 申請?zhí)枺?/td> | 202011065445.X | 申請日: | 2020-09-30 |
| 公開(公告)號: | CN112241368A | 公開(公告)日: | 2021-01-19 |
| 發(fā)明(設(shè)計(jì))人: | 劉潤芝 | 申請(專利權(quán))人: | 北京影譜科技股份有限公司 |
| 主分類號: | G06F11/36 | 分類號: | G06F11/36;G06F9/455;G06N3/08 |
| 代理公司: | 北京萬思博知識產(chǎn)權(quán)代理有限公司 11694 | 代理人: | 高鎮(zhèn) |
| 地址: | 100000 北京市朝陽區(qū)*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 kubernetes 自動化 模型 訓(xùn)練 方法 裝置 | ||
本申請公開了一種基于Kubernetes的自動化模型訓(xùn)練方法和裝置,涉及人工智能領(lǐng)域。該方法包括:對訓(xùn)練數(shù)據(jù)集和訓(xùn)練腳本進(jìn)行整理,使用Kubernetes創(chuàng)建虛擬化容器,在虛擬化容器中安裝并執(zhí)行需要的環(huán)境,將訓(xùn)練數(shù)據(jù)集拷貝到虛擬化容器內(nèi),調(diào)用訓(xùn)練腳本使用訓(xùn)練數(shù)據(jù)集自動執(zhí)行訓(xùn)練代碼,記錄本次訓(xùn)練的日志,存儲本次訓(xùn)練結(jié)果。該裝置包括:整理模塊、創(chuàng)建模塊、安裝模塊、拷貝模塊、訓(xùn)練模塊和存儲模塊。本申請實(shí)現(xiàn)了基于Kubernetes機(jī)制的深度學(xué)習(xí)網(wǎng)絡(luò)模型的自動化訓(xùn)練,減少了人工冗余和反復(fù)的操作,提高了模型訓(xùn)練的效率。
技術(shù)領(lǐng)域
本申請涉及人工智能領(lǐng)域,特別是涉及一種基于Kubernetes的自動化模型訓(xùn)練方法和裝置。
背景技術(shù)
隨著機(jī)器學(xué)習(xí)和人工智能的迅猛發(fā)展,業(yè)界出現(xiàn)了許多開源的機(jī)器學(xué)習(xí)平臺。目前,大多數(shù)場景仍舊是多人共享一臺或多臺機(jī)器,每次進(jìn)行數(shù)據(jù)訓(xùn)練前,用戶手動登錄遠(yuǎn)程服務(wù)器,下載代碼并依據(jù)requirements配置環(huán)境和代碼包,這其中極易出現(xiàn)安裝包版本的沖突,并且過程繁瑣,耗時(shí)較長。例如:有些依賴CUDA9,而有的卻需要CUDA10;還有就是對深度學(xué)習(xí)框架不同版本的依賴,如pytorch0.X版、pytorch1.X版、tensorflow1.8版等。
深度學(xué)習(xí)網(wǎng)絡(luò)模型的訓(xùn)練是指對使用帶標(biāo)簽的數(shù)據(jù)去訓(xùn)練模型,并預(yù)測未知數(shù)據(jù)的標(biāo)簽。對于多維度的模型訓(xùn)練,如果采用傳統(tǒng)的人工部署的方式,即針對不同維度進(jìn)行環(huán)境的搭建并完成代碼包的下載,在模型能力訓(xùn)練層面,需要依賴人工SSH的各種操作,訓(xùn)練的所有流程都需要人工參與。
發(fā)明內(nèi)容
本申請的目的在于克服上述問題或者至少部分地解決或緩減解決上述問題。
根據(jù)本申請的一個(gè)方面,提供了一種基于Kubernetes的自動化模型訓(xùn)練方法,包括:
對訓(xùn)練數(shù)據(jù)集和訓(xùn)練腳本進(jìn)行整理;
使用Kubernetes創(chuàng)建虛擬化容器;
在所述虛擬化容器中安裝并執(zhí)行需要的環(huán)境;
將所述訓(xùn)練數(shù)據(jù)集拷貝到所述虛擬化容器內(nèi);
調(diào)用所述訓(xùn)練腳本使用所述訓(xùn)練數(shù)據(jù)集自動執(zhí)行訓(xùn)練代碼;
記錄本次訓(xùn)練的日志,存儲本次訓(xùn)練結(jié)果。
可選地,對訓(xùn)練數(shù)據(jù)集和訓(xùn)練腳本進(jìn)行整理,包括:
將訓(xùn)練數(shù)據(jù)集和訓(xùn)練腳本保存在共享存儲的指定位置。
可選地,將所述訓(xùn)練數(shù)據(jù)集拷貝到所述虛擬化容器內(nèi),包括:
將所述訓(xùn)練數(shù)據(jù)集從所述共享存儲的指定位置拷貝到所述虛擬化容器內(nèi)。
可選地,所述方法還包括:
使用所述Kubernetes銷毀所述虛擬化容器。
可選地,所述方法還包括:
查詢歷史訓(xùn)練的日志,比較本次訓(xùn)練和歷史訓(xùn)練之間的差異。
根據(jù)本申請的另一個(gè)方面,提供了一種基于Kubernetes的自動化模型訓(xùn)練裝置,包括:
整理模塊,其配置成對訓(xùn)練數(shù)據(jù)集和訓(xùn)練腳本進(jìn)行整理;
創(chuàng)建模塊,其配置成使用Kubernetes創(chuàng)建虛擬化容器;
安裝模塊,其配置成在所述虛擬化容器中安裝并執(zhí)行需要的環(huán)境;
拷貝模塊,其配置成將所述訓(xùn)練數(shù)據(jù)集拷貝到所述虛擬化容器內(nèi);
訓(xùn)練模塊,其配置成調(diào)用所述訓(xùn)練腳本使用所述訓(xùn)練數(shù)據(jù)集自動執(zhí)行訓(xùn)練代碼;
存儲模塊,其配置成記錄本次訓(xùn)練的日志,存儲本次訓(xùn)練結(jié)果。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京影譜科技股份有限公司,未經(jīng)北京影譜科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011065445.X/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
- 一種基于Kubernetes的IMS系統(tǒng)
- 一種部署Kubernetes集群的方法、裝置和存儲介質(zhì)
- 部署Kubernetes集群的方法及裝置
- 一種Dubbo服務(wù)與Kubernetes系統(tǒng)集成的方法
- 一種基于OpenStack的Kubernetes集群搭建部署方法、架構(gòu)及存儲介質(zhì)
- 基于Kubernetes集群的服務(wù)訪問方法、裝置、設(shè)備及存儲介質(zhì)
- 一種Kubernetes容器云平臺應(yīng)用導(dǎo)入方法、系統(tǒng)
- 基于物理網(wǎng)卡的kubernetes網(wǎng)絡(luò)實(shí)現(xiàn)方法、系統(tǒng)、設(shè)備及介質(zhì)
- 多Kubernetes集群管理方法、裝置和可讀介質(zhì)
- Kubernetes上部署Kubernetes虛擬機(jī)集群的方法與系統(tǒng)
- 自動化設(shè)備和自動化系統(tǒng)
- 一種基于流程驅(qū)動的測試自動化方法以及測試自動化系統(tǒng)
- 用于工業(yè)自動化設(shè)備認(rèn)識的系統(tǒng)和方法
- 實(shí)現(xiàn)過程自動化服務(wù)的標(biāo)準(zhǔn)化設(shè)計(jì)方法學(xué)的自動化系統(tǒng)
- 一種日產(chǎn)50萬安時(shí)勻漿自動化系統(tǒng)
- 一種自動化肥料生產(chǎn)系統(tǒng)
- 一種電氣自動化設(shè)備自動檢測系統(tǒng)及檢測方法
- 用于自動化應(yīng)用的抽象層
- 一種基于虛擬化架構(gòu)的自動化系統(tǒng)功能驗(yàn)證方法
- 自動化測試框架自動測試的實(shí)現(xiàn)技術(shù)





