[發明專利]一種提高深度殘差脈沖神經網絡精度以優化圖像分類的方法及其系統在審
| 申請號: | 202010772308.3 | 申請日: | 2020-08-04 |
| 公開(公告)號: | CN111860790A | 公開(公告)日: | 2020-10-30 |
| 發明(設計)人: | 李麗;陳沁雨;傅玉祥;何書專;李偉 | 申請(專利權)人: | 南京大學 |
| 主分類號: | G06N3/04 | 分類號: | G06N3/04;G06N3/08;G06K9/62 |
| 代理公司: | 南京泰普專利代理事務所(普通合伙) 32360 | 代理人: | 張磊 |
| 地址: | 210023 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 提高 深度 脈沖 神經網絡 精度 優化 圖像 分類 方法 及其 系統 | ||
1.一種提高深度殘差脈沖神經網絡精度以優化圖像分類的方法,其特征在于包括如下步驟:
步驟1、解析:構建深度殘差神經網絡,針對深度神經網絡中的多種網絡結構進行解析;
步驟2、標準化:對網絡模型中的參數進行標準化處理;
步驟3、轉換:將參數標準化的網絡模型轉換為深度殘差脈沖神經網絡。
2.根據權利要求1所述的一種提高深度殘差脈沖神經網絡精度以優化圖像分類的方法,其特征在于,步驟1中所述解析過程進一步包括建立深度殘差脈沖神經網絡的基本網絡層,若對應的深度殘差神經網絡模型的某網絡層具有參數,則將該網絡層的參數加載到已建立的深度殘差脈沖神經網絡的網絡層中。
3.根據權利要求1所述的一種提高深度殘差脈沖神經網絡精度以優化圖像分類的方法,其特征在于,步驟1中所述解析過程進一步包括在建立深度殘差脈沖神經網絡的網絡層時,若遇到網絡模型中的批標準化層,則將批標準化層所有的參數吸收到上一層脈沖神經網絡的卷積層參數中。
4.根據權利要求1所述的一種提高深度殘差脈沖神經網絡精度以優化圖像分類的方法,其特征在于,步驟1中所述解析過程進一步包括在建立深度殘差脈沖神經網絡的網絡層時,若遇到深度殘差神經網絡中所特有的Add層,則對兩個維度相同的網絡層進行逐點相加。
5.根據權利要求1所述的一種提高深度殘差脈沖神經網絡精度以優化圖像分類的方法,其特征在于,步驟2中所述標準化過程進一步包括對深度殘差脈沖神經網絡中具有參數的網絡層進行參數標準化。
6.根據權利要求5所述的一種提高深度殘差脈沖神經網絡精度以優化圖像分類的方法,其特征在于,所述具有參數的網絡層至少包括卷積層和全連接層;所述參數標準化至少包括權重標準化和偏置標準化;
所述權重標準化由該層和上一層的縮放因子共同確定,在權重標準化過程中,首先對該層的權重參數乘以上一層縮放因子以恢復大小,然后除以該層縮放因子再進行縮小:
式中,表示權重標準化前當前層的參數,表示經過權重標準化后的參數;表示當前層的縮放因子,表示上一層的縮放因子。
7.根據權利要求6所述的一種提高深度殘差脈沖神經網絡精度以優化圖像分類的方法,其特征在于,所述縮放因子通過該層激活值分布的99.9%的大小來確定:
當遇到深度殘差神經網絡的Add層時,兩個網絡層同時進入該Add層進行運算,此時該層的上一層同時存在包括和在內的兩個縮放因子;此時取和的幾何平均值作為上層的統一化縮放因子:
隨后對和的值進行更新;
此時的權重標準化公式為:
式中,各符合含義同上。
8.根據權利要求5所述的一種提高深度殘差脈沖神經網絡精度以優化圖像分類的方法,其特征在于,所述偏置標準化過程通過分析該層的縮放因子所確定,在標準化過程中,參數除以該層縮放因子:
式中,表示偏置標準化前的當前層參數,表示經過偏置標準化后的參數;
在遇到短路連接的結構時,對縮放因子加入兩個超參數進行精度補償;其中,用于增大在短路結構恒等映射中卷積層的縮放因子,用于減小在短路結構非恒等映射中卷積層的縮放因子。
9.一種提高深度殘差脈沖神經網絡精度以優化圖像分類的系統,其特征在于包括如下模塊:
用于對深度神經網絡中的多種網絡結構進行解析的解析模塊;
用于對網絡模型中的參數進行標準化處理的標準化處理模塊;
用于將參數標準化的網絡模型轉換為深度殘差脈沖神經網絡的轉換處理模塊。
10.根據權利要求9所述的一種提高深度殘差脈沖神經網絡精度以優化圖像分類的系統,其特征在于,所述解析模塊進一步用于建立深度殘差脈沖神經網絡的基本網絡層,若對應的深度殘差神經網絡模型的某網絡層具有參數,則將該網絡層的參數加載到已建立的深度殘差脈沖神經網絡的網絡層中;在建立深度殘差脈沖神經網絡的網絡層時,若遇到網絡模型中的批標準化層,則將批標準化層所有的參數吸收到上一層脈沖神經網絡的卷積層參數中;若遇到深度殘差神經網絡中所特有的Add層,則對兩個維度相同的網絡層進行逐點相加;
所述標準化處理模塊進一步用于對深度殘差脈沖神經網絡中的卷積層和全連接層進行權重標準化和偏置標準化處理;權重標準化由該層和上一層的縮放因子共同確定,在權重標準化過程中,首先對該層的權重參數乘以上一層縮放因子以恢復大小,然后除以該層縮放因子再進行縮小:
式中,表示權重標準化前當前層的參數,表示經過權重標準化后的參數;表示當前層的縮放因子,表示上一層的縮放因子;
縮放因子通過該層激活值分布的99.9%的大小來確定:
當遇到深度殘差神經網絡的Add層時,兩個網絡層同時進入該Add層進行運算,此時該層的上一層同時存在包括和在內的兩個縮放因子;此時取和的幾何平均值作為上層的統一化縮放因子:
隨后對和的值進行更新;
此時的權重標準化公式為:
式中,各符合含義同上;
所述偏置標準化過程通過分析該層的縮放因子所確定,在標準化過程中,參數除以該層縮放因子:
式中,表示偏置標準化前的當前層參數,表示經過偏置標準化后的參數;
在遇到短路連接的結構時,對縮放因子加入兩個超參數進行精度補償;其中,用于增大在短路結構恒等映射中卷積層的縮放因子,用于減小在短路結構非恒等映射中卷積層的縮放因子。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京大學,未經南京大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010772308.3/1.html,轉載請聲明來源鉆瓜專利網。





