[發明專利]用于電子設備的神經網絡模型的硬加速方法和裝置在審
| 申請號: | 201810322936.4 | 申請日: | 2018-04-11 |
| 公開(公告)號: | CN108710941A | 公開(公告)日: | 2018-10-26 |
| 發明(設計)人: | 王文華;程愛蓮 | 申請(專利權)人: | 杭州菲數科技有限公司 |
| 主分類號: | G06N3/04 | 分類號: | G06N3/04;G06N3/063 |
| 代理公司: | 北京中政聯科專利代理事務所(普通合伙) 11489 | 代理人: | 陳超 |
| 地址: | 310051 浙江省杭州*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 神經網絡模型 電子設備 配置參數 方法和裝置 函數模塊 卷積 匹配 人工智能 函數計算 卷積計算 開發環境 算法更新 硬件設計 重新配置 自定義 調用 預設 學習 | ||
1.一種用于第一電子設備的神經網絡模型的硬加速方法,其特征在于,包括:
獲取待識別數據和第一神經網絡模型的配置參數;
根據所述配置參數對所述待識別數據進行與所述第一神經網絡模型相匹配的卷積計算的硬加速,得到所述第一神經網絡模型對所述待識別數據的卷積結果;
基于所述配置參數從預設的至少一個函數模塊中調用與所述第一神經網絡模型相匹配的一個或多個函數模塊對所述卷積結果進行函數計算的硬加速,得到所述第一神經網絡模型對所述待識別數據的識別結果。
2.根據權利要求1所述的方法,其特征在于,
所述配置參數包括:所述第一神經網絡模型的權重參數、卷積計算參數、所需調用函數參數中的一種或多種;
其中,所述權重參數為基于所述第一電子設備需要的格式對所述第一神經網絡模型的原始權重參數進行重新組合得到;
所述卷積計算參數包括:待識別數據的規格、卷積核的數量、卷積核的大小、卷積計算步長、神經網絡模型的層數中的一個或多個;
所述所需調用函數參數包括:所述第一神經網絡模型所需調用的函數名稱、函數參數及調用順序。
3.根據權利要求1或2所述的方法,其特征在于,所述對所述卷積結果進行函數計算的硬加速包括:
按照所述配置參數將所述一個或多個函數模塊通過跳轉通道進行連接;
將所述卷積結果輸入通過跳轉通道連接的所述一個或多個函數模塊,由所述一個或多個函數模塊順次進行硬加速并輸出結果。
4.根據權利要求1或2所述的方法,其特征在于,所述預設的至少一個函數模塊包括以下函數中的一種或多種:
標準化函數BatchNorm、縮放函數Scale、Eltwise函數、激活函數ReLU、激活函數Sigmoid、激活函數Tanh、池化函數Pooling、池化函數max pooling、池化函數meanpooling、池化函數root mean square pooling、全連接函數FC、分類函數Softmax。
5.根據權利要求1或2所述的方法,其特征在于,所述獲取待識別數據和第一神經網絡模型的配置參數包括:
從外部存儲器中讀取待識別數據和第一神經網絡模型的配置參數,并將讀取的待識別數據和第一神經網絡模型的配置參數寫入本地存儲器中。
6.根據權利要求5所述的方法,其特征在于,在讀取和寫入所述待識別數據時,對每個獨立的數據文件只進行一次讀取和寫入。
7.根據權利要求5所述的方法,其特征在于,
若讀取的待識別數據的規格是M×N×K,則在寫入時,通過M×(N1+N2)×(K1+K2)的拆分方式將所述待識別數據拆分為若干個小的三維矩陣;
其中,對于圖片文件,M代表圖片的寬度;N代表圖片的高度;K代表圖片的通道數;K1+K2=K;N1+N2=N。
8.一種用于第一電子設備的神經網絡模型的硬加速裝置,其特征在于,包括:
獲取模塊,用于獲取待識別數據和第一神經網絡模型的配置參數;
卷積計算模塊,用于根據配置參數對所述待識別數據進行與所述第一神經網絡模型相匹配的卷積計算的硬加速,得到所述第一神經網絡模型對所述待識別數據的卷積結果。
函數計算模塊,用于基于所述配置參數從預設的至少一個函數模塊中調用與所述第一神經網絡模型相關的一個或多個函數模塊對所述卷積結果進行函數計算的硬加速,得到所述第一神經網絡模型對所述待識別數據的識別結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州菲數科技有限公司,未經杭州菲數科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810322936.4/1.html,轉載請聲明來源鉆瓜專利網。





