[發明專利]一種深度學習系統的部署方法和裝置有效
| 申請號: | 202110651910.6 | 申請日: | 2021-06-11 |
| 公開(公告)號: | CN113254158B | 公開(公告)日: | 2021-10-12 |
| 發明(設計)人: | 芮法玲 | 申請(專利權)人: | 蘇州浪潮智能科技有限公司 |
| 主分類號: | G06F9/455 | 分類號: | G06F9/455;H04L12/24;H04L29/08 |
| 代理公司: | 北京連和連知識產權代理有限公司 11278 | 代理人: | 劉小峰;楊帆 |
| 地址: | 215100 江蘇省蘇州市吳*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 深度 學習 系統 部署 方法 裝置 | ||
1.一種深度學習系統的部署方法,其特征在于,包括執行以下步驟:
創建包括部署模塊的人工智能插件,定義第一節點組和第二節點組的節點組模板,其中所述節點組模板包括指示第一節點組所安裝的組件和第二節點組所安裝的組件,并且部署模塊中存儲有外殼腳本,所述外殼腳本包括網絡時間協議安裝腳本和網絡文件系統安裝腳本;
基于所述節點組模板定義設備組的集群模板,其中所述集群模板包括指示設備組中按照所述第一節點組來安裝組件的第一節點的數量和按照所述第二節點組來安裝組件的第二節點的數量;
校驗所述集群模板的配置合理性,并響應于所述集群模板的配置合理而基于所述集群模板與多個所述第一節點和多個所述第二節點相對應地創建分別具有人工智能框架的多個虛擬機;
由所述部署模塊向多個所述虛擬機分別部署同一時鐘和免密通信,基于所述集群模板而在多個所述虛擬機上選擇性地執行所述網絡時間協議安裝腳本和所述網絡文件系統安裝腳本,并由所述人工智能插件基于通信基準通過套接字命令使用所述外殼腳本分別向在所述集群模板中被指定的多個所述虛擬機的所述人工智能框架中導入深度學習鏡像;
其中,所述部署模塊中還存儲有圖形處理單元驅動安裝腳本;為多個所述虛擬機配置通信基準還包括:響應于檢測到存在所述虛擬機所對應的所述第一節點或所述第二節點配置有直接連接的圖形處理單元,而額外地針對所述虛擬機執行所述圖形處理單元驅動安裝腳本;
為多個所述虛擬機配置通信基準還包括:響應于檢測到存在所述虛擬機所對應的所述第一節點或所述第二節點將安裝的組件數量超過閾值,而向所述虛擬機安裝額外的高可用組件。
2.根據權利要求1所述的方法,其特征在于,還包括:在定義第一節點組和第二節點組的節點組模板之前先創建包括通用模塊的人工智能插件,所述通用模塊用于定義深度學習系統調用的所有組件;
定義第一節點組和第二節點組的節點組模板包括:從所述通用模塊獲取所有組件,并在由所有組件限定的范圍內定義所述第一節點組和所述第二節點組的所述節點組模板。
3.根據權利要求1所述的方法,其特征在于,還包括:在定義第一節點組和第二節點組的節點組模板之前先創建包括驗證模塊的人工智能插件;
多個組件包括控制組件和高可用組件;
校驗所述集群模板的配置合理性包括:使用所述驗證模塊檢查所述集群模板中多個所述第一節點和多個所述第二節點上分別將安裝的所述控制組件數量是否均為奇數、和/或將安裝的所述高可用組件是否均配置了宕機狀態檢測功能。
4.根據權利要求3所述的方法,其特征在于,響應于所述集群模板的配置合理而基于所述集群模板與多個所述第一節點和多個所述第二節點相對應地創建分別具有人工智能框架的多個虛擬機包括:
響應于所述集群模板中多個所述第一節點和多個所述第二節點上分別將安裝的所述控制組件數量均為奇數、和/或將安裝的所述高可用組件均配置了宕機狀態檢測功能,而判定所述集群模板的配置合理;
響應于所述集群模板的配置合理而由所述驗證模塊基于所述集群模板使用編排技術創建多個所述虛擬機,并向多個所述虛擬機中分別部署人工智能安裝包鏡像。
5.根據權利要求1所述的方法,其特征在于,還包括:在定義第一節點組和第二節點組的節點組模板之前先創建包括客戶端模塊的人工智能插件;在為多個所述虛擬機配置通信基準之后,還由所述客戶端模塊檢查配置是否成功。
6.一種深度學習系統的部署裝置,其特征在于,包括:
處理器;
控制器,存儲有所述處理器可運行的程序代碼,所述處理器在運行所述程序代碼時執行以下步驟:
創建包括部署模塊的人工智能插件,定義第一節點組和第二節點組的節點組模板,其中所述節點組模板包括指示第一節點組所安裝的組件和第二節點組所安裝的組件,并且部署模塊中存儲有外殼腳本,所述外殼腳本包括網絡時間協議安裝腳本和網絡文件系統安裝腳本;
基于所述節點組模板定義設備組的集群模板,其中所述集群模板包括指示設備組中按照所述第一節點組來安裝組件的第一節點的數量和按照所述第二節點組來安裝組件的第二節點的數量;
校驗所述集群模板的配置合理性,并響應于所述集群模板的配置合理而基于所述集群模板與多個所述第一節點和多個所述第二節點相對應地創建分別具有人工智能框架的多個虛擬機;
由所述部署模塊向多個所述虛擬機分別部署同一時鐘和免密通信,基于所述集群模板而在多個所述虛擬機上選擇性地執行所述網絡時間協議安裝腳本和所述網絡文件系統安裝腳本,并由所述人工智能插件基于通信基準通過套接字命令使用所述外殼腳本分別向在所述集群模板中被指定的多個所述虛擬機的所述人工智能框架中導入深度學習鏡像;
其中,所述部署模塊中還存儲有圖形處理單元驅動安裝腳本;為多個所述虛擬機配置通信基準還包括:響應于檢測到存在所述虛擬機所對應的所述第一節點或所述第二節點配置有直接連接的圖形處理單元,而額外地針對所述虛擬機執行所述圖形處理單元驅動安裝腳本;為多個所述虛擬機配置通信基準還包括:響應于檢測到存在所述虛擬機所對應的所述第一節點或所述第二節點將安裝的組件數量超過閾值,而向所述虛擬機安裝額外的高可用組件。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘇州浪潮智能科技有限公司,未經蘇州浪潮智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110651910.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:群組預測模型的測試方法、裝置和存儲介質及電子設備
- 下一篇:一種收卷裝置





