[發明專利]卷積神經網絡的診斷調整方法、系統、設備及介質有效
| 申請號: | 202011179621.2 | 申請日: | 2020-10-29 |
| 公開(公告)號: | CN112288077B | 公開(公告)日: | 2022-06-21 |
| 發明(設計)人: | 郭亞軍;郭曉威;張蕾;郭奕旻 | 申請(專利權)人: | 華中師范大學 |
| 主分類號: | G06N3/04 | 分類號: | G06N3/04;G06N3/08 |
| 代理公司: | 北京金智普華知識產權代理有限公司 11401 | 代理人: | 楊采良 |
| 地址: | 430079 湖*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 卷積 神經網絡 診斷 調整 方法 系統 設備 介質 | ||
1.一種卷積神經網絡的診斷調整方法,其特征在于,所述卷積神經網絡的診斷調整方法包括:
通過確定經過訓練的卷積神經網絡廣義卷積層的作用進行卷積神經網絡的診斷;
基于確定的廣義卷積層的作用根據具體的場景輸出相應的調整方案,進行模型調整;
所述確定廣義卷積層的作用包括:
步驟一,逐層計算卷積神經網絡中的廣義卷積層中的單位信息量即信息熵以及整體信息量;
步驟二,針對卷積神經網絡中的廣義卷積層,逐層計算整體信息量與前一層的廣義卷積層的差值;
步驟三,進行差值閾值設置,并判斷獲取的廣義卷積層的信息量差值是否超出閾值,基于判斷結果進行廣義卷積層是否具備提取作用的確定。
2.如權利要求1所述卷積神經網絡的診斷調整方法,其特征在于,步驟一中,所述信息熵計算公式如下:
E
其中,p(x0)代表經由激活函數后輸出中大于0的概率,p(x=0)代表經由激活函數后輸出中等于0的概率,n代表長度。
3.如權利要求1所述卷積神經網絡的診斷調整方法,其特征在于,步驟一中,所述整體信息量計算公式如下:
整體信息量=單位信息量*長度。
4.如權利要求1所述卷積神經網絡的診斷調整方法,其特征在于,步驟三中,所述基于判斷結果進行廣義卷積層是否具備提取作用的確定包括:
若某一廣義卷積層的信息量差值超出閾值,則該廣義卷積層具備提取作用;且差值越大,提取作用越強。
5.如權利要求1所述卷積神經網絡的診斷調整方法,其特征在于,所述基于確定的廣義卷積層的作用根據具體的場景輸出相應的調整方案進行模型調整包括:
根據模型結構是否合理輸出對應的調整方案,分別進行模型調整;
所述根據模型結構是否合理輸出對應的調整方案,分別進行模型調整包括:
當模型結構合理時,調整方案如下:
(1)當無法確定模型是否存在充足的準確率上升空間時,通過增大或者引入更多的提取層進行模型提取層調整,直至模型的準確率不再增加;
(2)在兩個相鄰的提取層中間加入變換層,直至模型的準確率不再提升。
6.如權利要求5所述卷積神經網絡的診斷調整方法,其特征在于,步驟(1)中,判斷廣義卷積層屬于提取層或者變換層,其依據在于它是否具備提取作用;
所述根據模型結構是否合理輸出對應的調整方案,分別進行模型調整還包括:
當模型結構不合理時,調整方案如下:
1)關注廣義卷積層作用的主客觀性,當模型設計者主觀認定該層為提取層,同時網絡診斷結果為變換層時,刪除該卷積層;
2)判斷是否連續出現兩個提取層,若是,則在兩個提取層間添加充分數量的變換層;
3)判斷模型中提取層的數量是否過多,若過多,則去除部分提取層;
步驟2)中,所述添加充分數量的變換層包括:通過是否能夠進行提升準確率確定添加變換層的數量。
7.一種卷積神經網絡的診斷調整系統,其特征在于,所述卷積神經網絡的診斷調整系統包括:
診斷模塊,用于通過確定經過訓練的卷積神經網絡廣義卷積層的作用進行卷積神經網絡的診斷;
調整建議輸出模塊,用于基于確定的廣義卷積層的作用根據具體的場景輸出相應的調整建議;
調整模塊,用于基于調整建議進行模型調整;
所述確定廣義卷積層的作用包括:
逐層計算卷積神經網絡中的廣義卷積層中的單位信息量即信息熵以及整體信息量;
針對卷積神經網絡中的廣義卷積層,逐層計算整體信息量與前一層的廣義卷積層的差值;
進行差值閾值設置,并判斷獲取的廣義卷積層的信息量差值是否超出閾值,基于判斷結果進行廣義卷積層是否具備提取作用的確定。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華中師范大學,未經華中師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011179621.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種化肥用灌溉設備及其灌溉方法
- 下一篇:日志生成方法、裝置以及可讀存儲介質





