[發(fā)明專利]池化方法、圖像處理方法及裝置有效
| 申請?zhí)枺?/td> | 201910022794.4 | 申請日: | 2019-01-10 |
| 公開(公告)號: | CN109726803B | 公開(公告)日: | 2021-06-29 |
| 發(fā)明(設計)人: | 谷愛國;蔡煬 | 申請(專利權(quán))人: | 廣州小狗機器人技術(shù)有限公司 |
| 主分類號: | G06N3/04 | 分類號: | G06N3/04 |
| 代理公司: | 北京集佳知識產(chǎn)權(quán)代理有限公司 11227 | 代理人: | 薛嬌;王寶筠 |
| 地址: | 510623 廣東省*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 方法 圖像 處理 裝置 | ||
本申請實施例公開了一種池化方法、圖像處理方法及裝置,在對圖像進行處理過程中,池化操作不僅考慮了空間域的特征,即實時位置處滑動窗口內(nèi)的特征,還考慮了時間域的特征,即相鄰特征圖中同一位置處滑動窗口內(nèi)的特征,提高了信息的利用率,從而提高處理精度。
技術(shù)領(lǐng)域
本申請涉及計算機視覺技術(shù)領(lǐng)域,更具體地說,涉及一種池化方法、圖像處理方法及裝置。
背景技術(shù)
卷積神經(jīng)網(wǎng)絡(Convolutional Neural Network,CNN)是一種前饋神經(jīng)網(wǎng)絡,擅長處理圖像特別是大圖像的相關(guān)機器學習問題。卷積神經(jīng)網(wǎng)絡包含了一個由卷積層(convolutional layer)和池化層(pooling layer)構(gòu)成的特征抽取器,其中,卷積層用于對輸入的圖像進行特征提取,得到特征圖序列;池化層則用于對卷積層輸出的每一幀特征圖進行降維處理。
目前,對于每一幀特征圖,池化層的池化方法是:通過一個滑動窗口在特征圖中滑動,每滑動到一個位置,根據(jù)滑動窗口內(nèi)的特征值進行池化運算,得到當前位置的池化后的特征值,以達到對特征圖降維的目的。
發(fā)明人在實現(xiàn)本申請的過程中發(fā)現(xiàn),基于目前的池化方法,卷積神經(jīng)網(wǎng)絡對圖像進行處理后,處理結(jié)果的精度較低。例如,卷積神經(jīng)網(wǎng)絡用于目標識別時,識別結(jié)果的精度較低。
發(fā)明內(nèi)容
本申請的目的是提供一種池化方法、圖像處理方法及裝置,以至少部分的克服現(xiàn)有技術(shù)中存在的技術(shù)問題。
為實現(xiàn)上述目的,本申請?zhí)峁┝巳缦录夹g(shù)方案:
一種池化方法,包括:
將滑動窗口在第一特征圖上滑動;
當所述滑動窗口滑動到第一位置時,根據(jù)所述第一特征圖以及與所述第一特征圖相鄰的第二特征圖中所述第一位置處的所述滑動窗口內(nèi)的特征值,進行池化運算,得到所述第一特征圖中所述第一位置處的池化后的特征值。
上述方法,優(yōu)選的,所述根據(jù)所述第一特征圖以及與所述第一特征圖相鄰的第二特征圖中所述第一位置處的所述滑動窗口內(nèi)的特征值,進行池化運算,包括:
根據(jù)所述第一特征圖中所述第一位置處所述滑動窗口內(nèi)的特征值,以及所述第二特征圖中所述第一位置處的所述滑動窗口內(nèi)預設區(qū)域內(nèi)的特征值,進行池化運算。
上述方法,優(yōu)選的,所述根據(jù)所述第一特征圖中所述第一位置處所述滑動窗口內(nèi)的特征值,以及所述第二特征圖中所述第一位置處的所述滑動窗口內(nèi)預設區(qū)域內(nèi)的特征值,進行池化運算,包括:
獲取所述第二特征圖中所述第一位置處所述滑動窗口內(nèi)預設區(qū)域內(nèi)的特征值;
對所述預設區(qū)域內(nèi)的特征值進行處理,得到區(qū)域特征值;
利用所述第一特征圖中所述第一位置處所述滑動窗口內(nèi)的特征值,以及所述區(qū)域特征值,進行池化運算。
上述方法,優(yōu)選的,所述根據(jù)所述第一特征圖中所述第一位置處所述滑動窗口內(nèi)的特征值,以及所述第二特征圖中所述第一位置處的所述滑動窗口內(nèi)預設區(qū)域內(nèi)的特征值,進行池化運算,包括:
利用所述第一特征圖中所述第一位置處所述滑動窗口內(nèi)的特征值,以及所述第二特征圖中所述第一位置處的所述滑動窗口內(nèi)預設區(qū)域內(nèi)的特征值,進行池化運算。
上述方法,優(yōu)選的,所述根據(jù)所述第一特征圖以及與所述第一特征圖相鄰的第二特征圖中所述第一位置處的所述滑動窗口內(nèi)的特征值,進行池化運算,包括:
根據(jù)所述第一特征圖中所述第一位置處所述滑動窗口內(nèi)的特征值,以及所述第二特征圖中所述第一位置處的所述滑動窗口內(nèi)的所有特征值,進行池化運算。
上述方法,優(yōu)選的,所述進行池化運算包括:
進行均值池化運算,或者,進行最大值池化運算。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣州小狗機器人技術(shù)有限公司,未經(jīng)廣州小狗機器人技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910022794.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





