[發明專利]網絡模型處理方法、裝置、設備、存儲介質在審
| 申請號: | 202111347772.9 | 申請日: | 2021-11-15 |
| 公開(公告)號: | CN114037063A | 公開(公告)日: | 2022-02-11 |
| 發明(設計)人: | 王燕飛;胡鵬;余鋒偉;胡健 | 申請(專利權)人: | 北京市商湯科技開發有限公司 |
| 主分類號: | G06N3/04 | 分類號: | G06N3/04;G06N3/063;G06N3/08 |
| 代理公司: | 北京派特恩知識產權代理有限公司 11270 | 代理人: | 馬麗;張穎玲 |
| 地址: | 100080 北京市海淀區北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 網絡 模型 處理 方法 裝置 設備 存儲 介質 | ||
本申請實施例公開了一種網絡模型處理方法、裝置、設備、存儲介質,其中,所述方法包括:獲取待處理的網絡模型和所述網絡模型的部署條件;基于所述部署條件,從設定的變換規則庫中,確定對所述網絡模型進行處理的目標變換規則;基于所述目標變換規則,對所述網絡模型進行至少一次子結構的等價變換處理,得到變換后的目標網絡模型。
技術領域
本申請涉及但不限于人工智能領域,尤其涉及一種網絡模型處理方法、裝置、設備、存儲介質。
背景技術
深度學習技術的應用為人們的生活提供了極大的便利,如拍照識物、刷臉支付、攝影增強等,無一不依賴相應的深度學習技術。隨著深度學習應用領域的擴大,產業界也越來越多的使用邊緣異構設備來提供人工智能能力,以降低成本、提高效率。然而,相關技術中的對同一網絡模型在多種硬件平臺上部署的過程中,存在網絡模型跨硬件平臺遷移困難,且同一模型在不同平臺上的實際性能相比理論算力差異較大的問題。
發明內容
有鑒于此,本申請實施例提供一種網絡模型處理方法、裝置、設備、存儲介質。
本申請實施例的技術方案是這樣實現的:
一方面,本申請實施例提供一種網絡模型處理方法,所述方法包括:
獲取待處理的網絡模型和所述網絡模型的部署條件;
基于所述部署條件,從設定的變換規則庫中,確定對所述網絡模型進行處理的目標變換規則;
基于所述目標變換規則,對所述網絡模型進行至少一次子結構的等價變換處理,得到變換后的目標網絡模型。
另一方面,本申請實施例提供一種網絡模型處理裝置,所述裝置包括:
獲取模塊,用于獲取待處理的網絡模型和所述網絡模型的部署條件;
第一確定模塊,用于基于所述部署條件,從設定的變換規則庫中,確定對所述網絡模型進行處理的目標變換規則;
變換模塊,用于基于所述目標變換規則,對所述網絡模型進行至少一次子結構的等價變換處理,得到變換后的目標網絡模型。
再一方面,本申請實施例提供一種計算機設備,包括存儲器和處理器,所述存儲器存儲有可在處理器上運行的計算機程序,所述處理器執行所述程序時實現上述方法中的部分或全部步驟。
又一方面,本申請實施例提供一種計算機可讀存儲介質,其上存儲有計算機程序,該計算機程序被處理器執行時實現上述方法中的部分或全部步驟。
又一方面,本申請實施例提供一種計算機程序,包括計算機可讀代碼,當所述計算機可讀代碼在計算機設備中運行時,所述展示設備中的處理器執行用于實現上述方法中的部分或全部步驟。
又一方面,本申請實施例提供一種計算機程序產品,所述計算機程序產品包括存儲了計算機程序的非瞬時性計算機可讀存儲介質,所述計算機程序被計算機讀取并執行時,實現上述方法中的部分或全部步驟。
本申請實施例中,通過獲取待處理的網絡模型和所述網絡模型的部署條件;基于所述部署條件,從設定的變換規則庫中,確定對所述網絡模型進行處理的目標變換規則;基于所述目標變換規則,對所述網絡模型進行至少一次子結構的等價變換處理,得到變換后的目標網絡模型。這樣,可以根據不同的部署條件,對網絡模型采用合適的變換規則進行子結構的等價變換處理,從而可以為同一網絡模型在不同硬件平臺上進行部署提供擴展支持,以便于網絡模型跨硬件平臺遷移,并能較好地對齊同一網絡模型在不同硬件平臺上的計算能力。
附圖說明
圖1為本申請實施例提供的一種網絡模型處理方法的實現流程示意圖;
圖2為本申請實施例提供的一種網絡模型處理方法的實現流程示意圖;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京市商湯科技開發有限公司,未經北京市商湯科技開發有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111347772.9/2.html,轉載請聲明來源鉆瓜專利網。





