[發(fā)明專利]深度學習模型轉換方法、系統(tǒng)及裝置有效
| 申請?zhí)枺?/td> | 201911267114.1 | 申請日: | 2019-12-11 |
| 公開(公告)號: | CN112947899B | 公開(公告)日: | 2023-09-26 |
| 發(fā)明(設計)人: | 馮仁光;葉挺群;王鵬 | 申請(專利權)人: | 杭州海康威視數(shù)字技術股份有限公司 |
| 主分類號: | G06F8/20 | 分類號: | G06F8/20;G06N20/00 |
| 代理公司: | 北京同立鈞成知識產(chǎn)權代理有限公司 11205 | 代理人: | 張子青;臧建明 |
| 地址: | 310051 浙*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 深度 學習 模型 轉換 方法 系統(tǒng) 裝置 | ||
本申請實施例提供一種深度學習模型轉換方法、系統(tǒng)及裝置,該方法包括:獲取第一模型的中間表示格式,所述第一模型為在第一深度學習框架下可識別的模型,所述第一模型中包括公共層和自定義層,所述中間表示格式為多個深度學習框架下進行模型轉換的統(tǒng)一表示格式,所述公共層為多個深度學習框架中均包括的層,即開源支持的層,所述自定義層為根據(jù)所述第一模型的功能進行配置得到的層,所述多個深度學習框架包括所述第一深度學習框架和第二深度學習框架;根據(jù)所述第一模型的中間表示格式和所述第二深度學習框架,得到第二模型,所述第二模型為在所述第二深度學習框架下可識別的模型。本申請實施例能夠實現(xiàn)針對包括自定義層的深度學習模型的轉換。
技術領域
本申請實施例涉及計算機技術領域,尤其涉及一種深度學習模型轉換方法、系統(tǒng)及裝置。
背景技術
深度學習模型是機器學習的一種,深度學習能夠獲得樣本數(shù)據(jù)的內(nèi)置規(guī)律和表示層次,在機器學習、搜索技術等多個領域具有重要的應用。
深度學習框架是用于開發(fā)深度學習模型而產(chǎn)生的,深度學習框架有多種,例如包括Caffe、TensorFlow、Torch等等。由于不同的深度學習框架對數(shù)據(jù)信息的存儲方式和解析方式存在較大差異,因此需要根據(jù)處理器的硬件結構差異將深度學習模型在不同的深度學習框架下進行轉換,以提高處理器的運算效率。
上述方案將深度學習模型在不同的深度學習框架下進行轉換時,只能針對由深度學習框架下已定義的功能層進行轉換,而不能針對自定義的功能層進行轉換。
發(fā)明內(nèi)容
本申請實施例提供一種深度學習模型轉換方法、系統(tǒng)及裝置,以解決根據(jù)處理器的硬件結構差異將深度學習模型在不同的深度學習框架下進行轉換,不能針對自定義層進行模型轉換的問題。
第一方面,本申請實施例提供一種深度學習模型轉換方法,包括:
獲取第一模型的中間表示格式,所述第一模型為在第一深度學習框架下可識別的模型,所述第一模型中包括公共層和自定義層,所述中間表示格式為多個深度學習框架下進行模型轉換的統(tǒng)一表示格式,所述公共層為多個深度學習框架中均包括的層,所述自定義層為根據(jù)所述第一模型的功能進行配置得到的層,所述多個深度學習框架包括所述第一深度學習框架和第二深度學習框架;
根據(jù)所述第一模型的中間表示格式和所述第二深度學習框架,得到第二模型,所述第二模型為在所述第二深度學習框架下可識別的模型。
在一種可能的實現(xiàn)方式中,所述獲取第一模型的中間表示格式,包括:
獲取所述第一模型的計算圖,所述計算圖用于指示所述第一模型的各公共層和各自定義層之間的連接關系;
獲取所述第一模型中的參數(shù)信息,根據(jù)所述參數(shù)信息和所述計算圖,得到所述第一模型的中間表示格式。
在一種可能的實現(xiàn)方式中,所述計算圖為粗粒度計算圖或細粒度計算圖,所述獲取所述第一模型的計算圖,包括:
獲取所述第一模型的粗粒度計算圖,其中,所述粗粒度計算圖中包括多個層節(jié)點、以及層節(jié)點之間的連接關系,每個所述層節(jié)點為一個所述公共層或一個所述自定義層;或者,
獲取所述第一模型的細粒度計算圖,其中,所述細粒度計算圖中包括多個計算節(jié)點、以及計算節(jié)點之間的連接關系,每個所述計算節(jié)點為一個子運算,所述子運算為所述自定義層的部分或所述公共層的部分。
在一種可能的實現(xiàn)方式中,所述計算圖為粗粒度計算圖,所述獲取所述第一模型中的參數(shù)信息,根據(jù)所述參數(shù)信息和所述計算圖,得到所述第一模型的中間表示格式,包括:
獲取多個中間表示格式節(jié)點和所述第一模型中的參數(shù)信息;
根據(jù)所述粗粒度計算圖獲取各公共層和各自定義層之間的第一連接關系;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州海康威視數(shù)字技術股份有限公司,未經(jīng)杭州海康威視數(shù)字技術股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911267114.1/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。





