[發明專利]一種模型部署方法、裝置、設備及介質在審
| 申請號: | 202210498334.0 | 申請日: | 2022-05-09 |
| 公開(公告)號: | CN114879953A | 公開(公告)日: | 2022-08-09 |
| 發明(設計)人: | 盧凌云;張晨;王全禮;李昱 | 申請(專利權)人: | 中國建設銀行股份有限公司;建信金融科技有限責任公司 |
| 主分類號: | G06F8/35 | 分類號: | G06F8/35;G06F8/61;G06F8/71;G06N20/00 |
| 代理公司: | 北京同達信恒知識產權代理有限公司 11291 | 代理人: | 王娜 |
| 地址: | 100033 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 模型 部署 方法 裝置 設備 介質 | ||
本申請涉及數據處理技術領域,尤其涉及一種模型部署方法、裝置、設備及介質。用以解決現有技術中在部署模型時,既需要專業人員的部署,又受到生產上線的窗口的限制的問題。由于在本申請實施例中是在電子設備中保存有模型的標識與算法的對應關系,因此當接收到的模型的第一標識后,可以確定該第一標識的模型對應的第一配置算法,從而采用該第一配置算法對該模型進行部署,從而可以避免在應用設備上進行部署,受生產上線的窗口限制的問題,并且不需要專業人員在每個模型上線時,分別撰寫部署每個模型的代碼,因此方便模型的應用。
技術領域
本申請涉及數據處理技術領域,尤其涉及一種模型部署方法、裝置、設備及介質。
背景技術
隨著深度學習在人工智能領域的崛起及不斷深化應用,以計算機視覺及自然語言處理技術為代表的新興技術已落地到各個行業。目前快速部署模型可以更快為企業提供更高的效益。
然而目前大多企業使用的模型均是在生產上線的窗口進行的部署,也就是說專業人員基本上都在固定時間在需要應用模型的應用設備上部署模型,例如每個月的1號由專業人員進行模型的部署,并且專業人員在進行模型的部署時,是通過撰寫支持模型運行的代碼,來將模型部署到企業對應的應用設備上。這既需要專業人員的部署,也受到生產上線的窗口的限制,不利于企業對模型的應用。
發明內容
本申請實施例提供一種模型部署方法、裝置、設備及介質,用以解決現有技術中在部署模型時,既需要專業人員的部署,又受到生產上線的窗口的限制的問題。
第一方面,本申請實施例提供了一種模型部署方法,所述方法包括:
接收訓練完成的模型以及所述模型的第一標識;
根據預先保存的模型的標識與算法的對應關系,確定所述第一標識對應的第一配置算法,通過所述第一配置算法部署所述模型;
生成部署完成的所述模型對應的第一模型服務,保存所述第一標識與所述第一模型服務的對應關系。
進一步地,所述方法還包括:
接收應用設備發送的應用請求,其中,所述應用請求中攜帶待使用的模型的第二標識;
根據保存的模型的標識與模型服務的對應關系,確定所述第二標識對應的第二模型服務,將所述第二模型服務發送至所述應用設備。
進一步地,所述方法還包括:
若接收到組合服務生成請求,則獲取所述組合服務生成請求中攜帶的推理圖、所述推理圖中每個節點中記錄待組合的模型的第三標識及組合服務對應的第四標識;
根據保存的模型的標識與模型服務的對應關系,確定所述第三標識對應的第三模型服務;
按照所述推理圖中節點之間的連接關系,將所述推理圖中每個節點對應的第三模型服務進行組合得到組合服務;
在保存的模型的標識與模型服務的對應關系中添加所述第四標識與所述組合服務的對應關系。
進一步地,所述確定所述第一標識對應的第一配置算法之后,所述通過所述第一配置算法部署所述模型之前,所述方法還包括:
構建所述第一配置算法的鏡像;
所述通過所述第一配置算法部署所述模型包括:
運行所述鏡像生成對應的容器,在所述容器中通過所述第一配置算法部署所述模型。
進一步地,所述方法還包括:
若第五標識對應的第四模型服務當前滿足預設的停用條件,則停用所述第四模型服務,釋放所述第四模型服務占用的資源。
進一步地,所述第五標識對應的第四模型服務當前滿足預設的停用條件包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國建設銀行股份有限公司;建信金融科技有限責任公司,未經中國建設銀行股份有限公司;建信金融科技有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210498334.0/2.html,轉載請聲明來源鉆瓜專利網。





