[發明專利]一種用于神經網絡的池化方法及裝置在審
| 申請號: | 202010039300.6 | 申請日: | 2020-01-14 |
| 公開(公告)號: | CN113191480A | 公開(公告)日: | 2021-07-30 |
| 發明(設計)人: | 范坤;陳邁越 | 申請(專利權)人: | 北京地平線機器人技術研發有限公司 |
| 主分類號: | G06N3/04 | 分類號: | G06N3/04;G06N3/08 |
| 代理公司: | 北京嘉科知識產權代理事務所(特殊普通合伙) 11687 | 代理人: | 楊波 |
| 地址: | 100086 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 用于 神經網絡 方法 裝置 | ||
公開了一種用于神經網絡的池化方法、裝置、計算機可讀存儲介質及電子設備,該方法包括:將圖像輸入神經網絡的卷積層,得到特征圖;根據預設池化步長,獲取所述特征圖在預設數據窗口下的矩陣元素;根據所述矩陣元素中的噪聲元素,確定所述矩陣元素的第一均值集合;根據所述矩陣元素的第一均值集合,確定所述矩陣元素的池化輸出值。本公開的技術方案通過考慮數據窗口內的噪聲元素,以降低池化過程引入噪聲元素的可能性,從而提高池化輸出值的準確性,進而提高神經網絡的精度。
技術領域
本申請涉及深度學習技術領域,且更具體地,涉及一種用于神經網絡的池化方法及裝置。
背景技術
神經網絡是人工智能領域具有高發展水平的感知模型之一,因其廣泛的應用和出色的表現使其成為了學術界和工業界的研究熱點。神經網絡通過模擬人類大腦的神經連接結構來建立模型,為大規模數據(例如圖像、視頻或音頻)處理任務帶來了突破性進展。神經網絡的計算過程一般可分為卷積、激活、池化等步驟,其中,神經網絡的各層次特征圖通常需要進行池化操作,以降低特征圖的尺寸,從而減少計算量。
目前,主要通過最大池化對特征圖進行池化操作。
但是,最大池化對異常值不敏感,比如,對于數據窗口內的4個元素:1,2,1,255,此時,最大池化就會用最大值255代替這個數據窗口內的4個元素,但是這種情況下255很有可能是一個白噪點,使用255替代這個數據窗口內的元素就會引入這個白噪點,從而降低神經網絡的精度。
發明內容
為了解決上述技術問題,提出了本申請。本申請的實施例提供了一種用于神經網絡的池化方法、裝置、計算機可讀存儲介質及電子設備,通過考慮數據窗口內的噪聲元素,以降低池化過程引入噪聲元素的可能性,從而提高池化輸出值的準確性,進而提高神經網絡的精度。
根據本申請的一個方面,提供了一種用于神經網絡的池化方法,包括:
將圖像輸入神經網絡的卷積層,得到特征圖;
根據預設池化步長,獲取所述特征圖在預設數據窗口下的矩陣元素;
根據所述矩陣元素中的噪聲元素,確定所述矩陣元素的第一均值集合;
根據所述矩陣元素的第一均值集合,確定所述矩陣元素的池化輸出值。
根據本申請的第二方面,提供了一種用于神經網絡的池化裝置,包括:
特征提取模塊,用于將圖像輸入神經網絡的卷積層,得到特征圖;
獲取模塊,用于根據預設池化步長,獲取所述特征圖在預設數據窗口下的矩陣元素;
計算模塊,用于根據所述矩陣元素中的噪聲元素,確定所述矩陣元素的第一均值集合;
輸出模塊,用于根據所述矩陣元素的第一均值集合,確定所述矩陣元素的池化輸出值。
根據本申請的第三方面,提供了一種計算機可讀存儲介質,所述存儲介質存儲有計算機程序,所述計算機程序用于執行上述的用于神經網絡的池化方法。
根據本申請的第四方面,提供了一種電子設備,所述電子設備包括:
處理器;
用于存儲所述處理器可執行指令的存儲器;
所述處理器,用于從所述存儲器中讀取所述可執行指令,并執行所述指令以實現上述的用于神經網絡的池化方法。
與現有技術相比,本申請提供的一種用于神經網絡的池化方法、裝置、計算機可讀存儲介質及電子設備,至少包括以下有益效果:
本實施例通過考慮數據窗口內的噪聲元素,以降低池化過程引入噪聲元素的可能性,從而提高池化輸出值的準確性,進而提高神經網絡的精度。
附圖說明
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京地平線機器人技術研發有限公司,未經北京地平線機器人技術研發有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010039300.6/2.html,轉載請聲明來源鉆瓜專利網。





