[發明專利]深度學習模型生成方法、裝置、設備及存儲介質有效
| 申請號: | 201910897445.7 | 申請日: | 2019-09-23 |
| 公開(公告)號: | CN110598855B | 公開(公告)日: | 2023-06-09 |
| 發明(設計)人: | 譚志鵬;劉耀勇;蔣燚 | 申請(專利權)人: | OPPO廣東移動通信有限公司 |
| 主分類號: | G06N3/04 | 分類號: | G06N3/04;G06N3/08;G06N5/04;G06F8/41 |
| 代理公司: | 北京三高永信知識產權代理有限責任公司 11138 | 代理人: | 邢少真 |
| 地址: | 523860 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 深度 學習 模型 生成 方法 裝置 設備 存儲 介質 | ||
本申請實施例公開了一種深度學習模型生成方法、裝置、設備及存儲介質,屬于深度學習領域。該方法包括:根據深度學習模型的模型文件生成第一源文件,模型文件包含所述深度學習模型中的權值矩陣;獲取深度學習模型對應的第二源文件;對第一源文件和第二源文件進行編譯,生成深度學習模型對應的目標文件。采用本申請實施例提供的方法,通過預先根據深度學習模型中的權值矩陣生成第一源文件,從而在編譯過程中,同時對第一源文件以及神經網絡結構對應的第二源文件進行編譯,生成深度學習模型對應的目標文件,在深度學習模型的編譯階段即可完成權值矩陣的數據加載,后續模型推理過程中不需要重新加載權值矩陣,進而提高了深度學習模型推理的效率。
技術領域
本申請實施例涉及深度學習領域,特別涉及一種深度學習模型生成方法、裝置、設備及存儲介質。
背景技術
深度學習的網絡結構是多層神經網絡的一種,其模型中大部分數據是權值矩陣的數值。深度學習模型為了完成模型推理,會采用合適的數據結構來定義神經網絡結構。
深度學習模型進行模型推理時,首先需要把模型加載到深度學習模型所采用的神經網絡結構中,模型加載的一般做法,是把模型當做文件,在運行神經網絡結構的代碼時把模型文件加載到內存中,再從內存拷貝數據到神經網絡結構中。
上述過程中,在神經網絡結構運行時需要拷貝所有權值矩陣的數據,這種內存拷貝非常耗時,嚴重影響深度學習模型推理的效率。
發明內容
本申請實施例提供了一種深度學習模型生成方法、裝置、設備及存儲介質。
所述技術方案如下:
一方面,本申請實施例提供了一種深度學習模型生成方法,所述方法包括:
根據深度學習模型的模型文件生成第一源文件,所述模型文件包含所述深度學習模型中的權值矩陣;
獲取所述深度學習模型對應的第二源文件,所述第二源文件為所述深度學習模型所采用神經網絡結構的源文件;
對所述第一源文件和所述第二源文件進行編譯,生成所述深度學習模型對應的目標文件。
另一方面,本申請實施例提供了一種深度學習模型生成裝置,所述裝置包括:
第一生成模塊,用于根據深度學習模型的模型文件生成第一源文件,所述模型文件包含所述深度學習模型中的權值矩陣;
第一獲取模塊,用于獲取所述深度學習模型對應的第二源文件,所述第二源文件為所述深度學習模型所采用神經網絡結構的源文件;
第二生成模塊,用于對所述第一源文件和所述第二源文件進行編譯,生成所述深度學習模型對應的目標文件。
另一方面,本申請實施例提供了一種計算機設備,所述計算機設備包括處理器和存儲器;所述存儲器存儲有至少一條指令,所述至少一條指令用于被所述處理器執行以實現如上述方面所述的深度學習模型生成方法。
另一方面,提供了一種計算機可讀存儲介質,所述存儲介質存儲有至少一條指令,所述至少一條指令用于被處理器執行以實現如上述方面所述的深度學習模型生成方法。
另一方面,還提供了一種計算機程序產品,該計算機程序產品存儲有至少一條指令,所述至少一條指令由處理器加載并執行以實現上述方面所述的深度學習模型生成方法。
本申請實施例提供的技術方案的有益效果至少包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于OPPO廣東移動通信有限公司,未經OPPO廣東移動通信有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910897445.7/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種基于GRU模型的臺區線損率預測方法
- 下一篇:基于人工神經網絡的設置方法





