[發明專利]一種設備的調度方法有效
| 申請號: | 201910734672.8 | 申請日: | 2019-08-09 |
| 公開(公告)號: | CN110471767B | 公開(公告)日: | 2021-09-03 |
| 發明(設計)人: | 不公告發明人 | 申請(專利權)人: | 上海寒武紀信息科技有限公司 |
| 主分類號: | G06F9/50 | 分類號: | G06F9/50;G06N20/00 |
| 代理公司: | 北京律譜知識產權代理事務所(普通合伙) 11457 | 代理人: | 黃云鐸 |
| 地址: | 200120 上海市浦*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 設備 調度 方法 | ||
1.一種設備的調度方法,其特征在于,所述調度方法適用于kubernetes系統框架對單元設備的調用,所述kubernetes系統框架連接有多個物理機,任一個所述物理機連接有多個所述單元設備,所述單元設備為機器學習單元,所述物理機上運行有設備插件,該調度方法包括:
步驟1,所述設備插件根據與所述物理機相連的所述單元設備的設備數量,確定所述單元設備的設備路徑,并根據所述設備路徑,獲取所述單元設備的設備唯一標識符;
步驟2,所述設備插件將所述設備路徑和所述設備唯一標識符關聯,生成映射表,并調用設備管理工具庫,根據所述設備路徑獲取所述單元設備的設備健康信息,將所述設備唯一標識符和所述設備健康信息發送至所述系統框架;
步驟3,所述系統框架判定所述設備健康信息正常時,所述設備插件根據所述映射表確定所述單元設備的設備路徑,所述系統框架根據所述設備路徑調用所述單元設備。
2.如權利要求1所述的設備的調度方法,其特征在于,所述映射表存儲于所述設備插件。
3.如權利要求1所述的設備的調度方法,其特征在于,步驟1中獲取所述單元設備的設備唯一標識符,具體包括:
步驟11,所述設備插件建立與所述機器學習單元之間的數據傳輸通道,并判斷是否能夠獲取所述機器學習單元的設備唯一標識符,若不能夠,執行步驟12,若能夠,執行步驟13;
步驟12,根據隨機生成函數,生成所述機器學習單元的所述設備唯一標識符;
步驟13,根據所述設備路徑,確定該機器學習單元的所述設備唯一標識符。
4.如權利要求1所述的設備的調度方法,其特征在于,步驟2中,所述設備插件調用所述設備管理工具庫,根據所述設備路徑獲取所述機器學習單元的所述設備健康信息,具體包括:
根據預設輪詢周期,所述設備插件調用所述設備管理工具庫提供的接口函數,所述設備管理工具庫根據所述設備路徑,獲取所述設備健康信息。
5.如權利要求1所述的設備的調度方法,其特征在于,步驟3中,所述kubernetes框架判定所述設備健康信息正常的方法,具體包括:
所述kubernetes框架接收所述設備插件發送的grpc消息;
讀取所述grpc消息的返回信息中的healthy字段,當判定所述healthy字段為true時,判定所述設備健康信息正常。
6.如權利要求1所述的設備的調度方法,其特征在于,步驟1中,確定所述單元設備的設備路徑的步驟包括:
所述設備插件調用所述設備管理工具庫,獲得所述物理機連接的所述機器學習單元總數n,并生成所述機器學習單元的設備序號;
通過所述機器學習單元驅動預定的設備路徑命名規則,根據設備路徑前綴和所述設備序號,生成所述設備路徑。
7.如權利要求1所述的設備的調度方法,其特征在于,該調度方法還包括:
當所述kubernetes框架接收到框架重啟指令時,所述設備插件將檢測到所述kubernetes框架的重啟,并在所述kubernetes框架重啟結束后重新連接至所述kubernetes框架。
8.如權利要求1至7中任一項所述的設備的調度方法,其特征在于,該調度方法還包括:
當所述機器學習單元與所述物理機斷開連接時,釋放所述機器學習單元占用的系統資源。
9.如權利要求8所述的設備的調度方法,其特征在于,該調度方法還包括:
所述設備插件調用測試樁工具庫,并根據所述設備路徑對所述機器學習單元進行測試。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海寒武紀信息科技有限公司,未經上海寒武紀信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910734672.8/1.html,轉載請聲明來源鉆瓜專利網。





