[發(fā)明專利]深度神經網絡模型的處理方法、裝置和設備有效
| 申請?zhí)枺?/td> | 201810150453.0 | 申請日: | 2018-02-13 |
| 公開(公告)號: | CN108334946B | 公開(公告)日: | 2022-03-29 |
| 發(fā)明(設計)人: | 楊弋;周舒暢 | 申請(專利權)人: | 北京曠視科技有限公司 |
| 主分類號: | G06N3/063 | 分類號: | G06N3/063;G06F9/308;G06F9/302 |
| 代理公司: | 北京超凡志成知識產權代理事務所(普通合伙) 11371 | 代理人: | 王術蘭 |
| 地址: | 100000 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 深度 神經網絡 模型 處理 方法 裝置 設備 | ||
1.一種深度神經網絡模型的處理方法,其特征在于,包括:
獲取神經網絡的第一目標計算層的多個輸入數據;其中,所述第一目標計算層為深度神經網絡模型所包含的依次連接的多個計算層中除前兩個計算層之外的其他計算層,所述多個輸入數據為所述深度神經網絡模型中位于所述第一目標計算層之前且與所述第一目標計算層直接連接或通過短路邊連接的多個計算層的計算結果,所述輸入數據的位寬不超過預設位寬,所述短路邊表示繞開所述深度神經網絡模型的至少一層的網絡連接關系;
通過所述第一目標計算層的起始位置的位操作處理層對所述多個輸入數據進行位運算,得到位運算結果,并將所述位運算結果作為所述第一目標計算層的輸入數據進行處理,所述位運算結果為所述多個輸入數據的相加或相乘輸出數據。
2.根據權利要求1所述的方法,其特征在于,每個所述計算層包括卷積層和非線性處理層,所述非線性處理層為離散定點化處理層。
3.根據權利要求1所述的方法,其特征在于,獲取神經網絡的第一目標計算層的多個輸入數據包括:
確定多個第二目標計算層,其中,所述第二目標計算層為所述第一目標計算層的前一個計算層和通過短路邊與所述第一目標計算層相連接的計算層,所述短路邊表示繞開所述深度神經網絡模型的至少一層的網絡連接關系;
確定所述多個第二目標計算層的計算結果為所述第一目標計算層的所述多個輸入數據。
4.根據權利要求3所述的方法,其特征在于,確定多個第二目標計算層包括:
當所述深度神經網絡模型中包含依次連接的多個計算層的數量為2N時,確定所述神經網絡中第i-2n-1個計算層為所述第一目標計算層Ai的多個第二目標計算層,其中,第i-1個計算層為所述第一目標計算層Ai的前一個計算層,剩余計算層為通過短路邊與所述第一目標計算層相連接的計算層,i-2n-1和n均為正整數,且n依次取1至N。
5.根據權利要求1所述的方法,其特征在于,所述計算結果為離散定點化處理之后的計算結果,通過所述第一目標計算層的起始位置的位操作處理層對所述多個輸入數據進行位運算,得到位運算結果包括:
通過所述第一目標計算層的起始位置的位操作處理層對所述離散定點化處理之后的計算結果進行位運算,得到所述位運算結果。
6.根據權利要求1所述的方法,其特征在于,當在處理器中對所述深度神經網絡模型的第一目標計算層進行數據計算時,所述方法還包括:
在所述處理器所對應的集成電路中,按照所述第一目標計算層的計算邏輯為所述第一目標計算層分配邏輯計算電路,以使所述邏輯計算電路對所述多個輸入數據進行相應的位運算。
7.根據權利要求1所述的方法,其特征在于,所述方法還包括:
獲取原始深度神經網絡模型;
在所述原始深度神經網絡模型中計算層的數量為2N時,在第i個計算層和第i-2k-1個計算層之間依次構建短路邊,其中,i為大于2的正整數,i-2k-1和n均為正整數,且k依次取2至N,所述短路邊表示繞開所述原始深度神經網絡模型的至少一層的網絡連接關系;
在所述第i個計算層的卷積層之前,構建位操作處理層,并將構建之后的原始深度神經網絡模型作為所述深度神經網絡模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京曠視科技有限公司,未經北京曠視科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810150453.0/1.html,轉載請聲明來源鉆瓜專利網。





