日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]模型推理的資源分配方法、裝置、計算機設備和存儲介質有效

專利信息
申請號: 202010062893.8 申請日: 2020-01-19
公開(公告)號: CN111274034B 公開(公告)日: 2023-06-30
發明(設計)人: 陳可;董峰 申請(專利權)人: 北京奇藝世紀科技有限公司
主分類號: G06F9/50 分類號: G06F9/50
代理公司: 北京華夏泰和知識產權代理有限公司 11662 代理人: 張麗穎;李雪
地址: 100080 北京市海淀區*** 國省代碼: 北京;11
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 模型 推理 資源 分配 方法 裝置 計算機 設備 存儲 介質
【權利要求書】:

1.一種模型推理的資源分配方法,其特征在于,所述方法包括:

獲取加速板卡的數量,各個所述加速板卡上搭載有多個加速芯片;

獲取待分配深度模型和所述待分配深度模型的各個計算層的時間開銷;

根據各個所述計算層的時間開銷,確定所述待分配深度模型拆分成多個目標子模型的模型拆分策略,每個所述加速板卡對應一個所述目標子模型,每個所述目標子模型的時間開銷位于第一預設開銷區間內;

根據各個所述計算層的時間開銷,確定各個所述加速板卡的目標子模型拆分成與對應的各個所述加速板卡上的芯片相同數量的目標子單元的子模型拆分策略,每個所述加速芯片對應一個所述目標子單元,每個所述目標子單元的時間開銷位于第二預設開銷區間內;

所述方法還包括:

獲取每個所述加速板卡的資源和對應的所述目標子模型的需求計算資源;

根據每個所述加速板卡的資源和對應的所述目標子模型的需求資源,確定各個所述目標子模型進行拆分和/或合并的模型調整策略,以使按照拆分和/或合并后得到的每個所述加速板卡的目標子模型的資源開銷小于或等于對應的所述加速板卡的資源上限。

2.根據權利要求1所述的方法,其特征在于,所述方法還包括:

獲取每個所述加速板卡的傳輸開銷和對應的所述目標子模型的傳輸開銷;

根據每個所述加速板卡的傳輸開銷和對應的所述目標子模型的傳輸開銷,確定各個所述目標子模型進行拆分和/或合并的模型調整策略,以使執行拆分和/或合并后得到的每個所述加速板卡的目標子模型時所需的傳輸開銷小于或等于對應的所述加速板卡的預設傳輸開銷上限。

3.根據權利要求1或2所述的方法,其特征在于,所述方法還包括:

獲取每個所述加速板卡的資源和對應的所述目標子模型的需求資源;

根據每個所述加速板卡上的芯片的資源和對應的所述目標子單元的需求資源,確定對各個所述目標子單元進行拆分和/或合并的單元調整策略,以使拆分和/或合并后得到的每個所述加速板卡的芯片的目標子單元的資源小于或等于對應的所述加速板卡的芯片的資源上限。

4.根據權利要求3所述的方法,其特征在于,所述方法還包括:

獲取每個所述加速板卡的芯片的傳輸開銷和對應的所述目標子單元的傳輸開銷;

根據每個所述加速板卡的芯片的傳輸開銷和對應的所述目標子單元的傳輸開銷,確定各個所述目標子單元進行拆分和/或合并的單元調整策略,以使每個所述加速板卡的芯片的傳輸開銷小于或等于對應的所述目標子單元的傳輸開銷。

5.根據權利要求2所述的方法,其特征在于,所述模型調整策略,包括:

判斷當前板卡對應的模型的資源或傳輸開銷是否符合所述當前板卡的資源或傳輸開銷;

當所述當前板卡對應的模型的資源或傳輸開銷不符合所述當前板卡的資源或傳輸開銷時,將所述當前板卡對應的模型進行拆分,得到第一子模型和第二子模型,以使所述第一子模型符合所述當前板卡的資源或傳輸開銷;

合并所述第二子模型和所述當前板卡的相鄰的下一板卡的模型,得到合并模型;

將所述下一板卡作為所述當前板卡,判斷當前板卡對應的所述合并模型對應的資源或傳輸開銷是否符合所述當前板卡的資源或傳輸開銷。

6.根據權利要求5所述的方法,其特征在于,所述將所述當前板卡對應的模型進行拆分,得到第一子模型和第二子模型,包括:

對所述當前板卡對應的模型中的計算層,按照連接順序從位于末端的計算層進行拆分,將末端拆分出來的計算層作為所述第二子模型,剩余的計算層作為所述第一子模型。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京奇藝世紀科技有限公司,未經北京奇藝世紀科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202010062893.8/1.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 国v精品久久久网| 国产欧美精品一区二区三区小说 | 欧美日本一二三区| 国产精品久久久久久久久久久久久久久久久久| 国产二区免费视频| 少妇精品久久久久www蜜月| 亚洲精品www久久久久久广东| 久久久久亚洲精品视频| 玖玖爱国产精品| 亚洲高清久久久| 国产精品一区一区三区| av午夜在线观看| 久99久视频| 首页亚洲欧美制服丝腿| 国产精一区二区三区| 香港日本韩国三级少妇在线观看| 国产精品伦一区二区三区级视频频| 国产高潮国产高潮久久久91| 亚洲午夜久久久久久久久电影院| 亚洲少妇中文字幕| 国产精品视频久久久久| 免费超级乱淫视频播放| 国产偷自视频区视频一区二区| 精品国产乱码久久久久久虫虫 | 日本一码二码三码视频| 国产午夜精品一区二区三区最新电影| 久久夜靖品2区| 色婷婷精品久久二区二区6| 国产区一区| 国产不卡三区| 996久久国产精品线观看| 日韩欧美一区二区久久婷婷| 亚洲精品久久久中文| 国产91久| 91丝袜国产在线播放| 日韩一区二区三区福利视频| 国产精品国产三级国产专区55| 日韩有码一区二区三区| 男女午夜爽爽| 国产真实乱偷精品视频免| 国产视频一区二区不卡| 国产资源一区二区| 91麻豆精品国产91久久久久推荐资源 | 亚洲一二三在线| 日韩亚洲国产精品| 亚洲精品卡一卡二| 久久国产精品久久久久久电车| 欧美精品一区二区性色| 亚洲国产精品精品| 亚洲精品一区中文字幕| 亚洲国产欧美一区| 91看黄网站| 91麻豆精品一区二区三区| 91午夜在线| 国产午夜一区二区三区| 久久一区二| 男人的天堂一区二区| 69久久夜色精品国产69乱青草| 久久免费视频一区| 91精品色| 日韩精品免费一区二区中文字幕| 黄毛片在线观看| 国产一二区精品| 99精品免费在线视频| 国产精品国精产品一二三区| 国产欧美亚洲精品| 一区二区三区国产精品视频| 国产99久久久久久免费看| 久久两性视频| 国产视频一区二区在线| 欧美一区二区色| 综合色婷婷一区二区亚洲欧美国产 | 久久精品国产精品亚洲红杏| 国产欧美综合一区| 国产69精品久久久久777糖心| 综合久久国产九一剧情麻豆| 亚洲欧美国产精品一区二区| 国产乱xxxxx国语对白| 日韩av不卡一区二区| 午夜三级大片| 国产视频一区二区在线播放| 91久久精品在线|