[發(fā)明專利]圖像處理方法、裝置、計算機可讀介質(zhì)及電子設(shè)備有效
| 申請?zhí)枺?/td> | 201810588686.9 | 申請日: | 2018-06-08 | 
| 公開(公告)號: | CN110163215B | 公開(公告)日: | 2022-08-23 | 
| 發(fā)明(設(shè)計)人: | 陳衛(wèi)東;吳保元;劉威 | 申請(專利權(quán))人: | 騰訊科技(深圳)有限公司 | 
| 主分類號: | G06V10/40 | 分類號: | G06V10/40;G06V10/82;G06N3/04 | 
| 代理公司: | 深圳市聯(lián)鼎知識產(chǎn)權(quán)代理有限公司 44232 | 代理人: | 劉抗美 | 
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 | 
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 | 
| 摘要: | |||
| 搜索關(guān)鍵詞: | 圖像 處理 方法 裝置 計算機 可讀 介質(zhì) 電子設(shè)備 | ||
1.一種圖像處理方法,其特征在于,包括:
獲取待處理的目標圖像;
基于殘差網(wǎng)絡(luò)對所述目標圖像進行特征提取,得到圖像特征信息,所述殘差網(wǎng)絡(luò)包含順次相連的多個殘差塊,每個所述殘差塊包含卷積分支和殘差分支,所述卷積分支中的第一卷積層的卷積核大小小于位于所述第一卷積層之后的第二卷積層的卷積核大小,所述第二卷積層的卷積步長大于所述第一卷積層的卷積步長且小于所述第二卷積層的卷積核寬度;
根據(jù)所述圖像特征信息對所述待處理圖像進行識別處理。
2.根據(jù)權(quán)利要求1所述的圖像處理方法,其特征在于,所述殘差網(wǎng)絡(luò)還包含位于所述多個殘差塊之前的初始卷積層,所述初始卷積層的輸出作為所述多個殘差塊中第一個殘差塊的輸入。
3.根據(jù)權(quán)利要求1所述的圖像處理方法,其特征在于,所述多個殘差塊構(gòu)成多個卷積階段,每個所述卷積階段中的第一個殘差塊包含的所述殘差分支包含順次相連的一批量歸一化處理層和一目標卷積層。
4.根據(jù)權(quán)利要求1所述的圖像處理方法,其特征在于,所述卷積分支還包括第三卷積層,所述第一卷積層、所述第二卷積層和所述第三卷積層順次相連;
其中,所述第一卷積層和所述第三卷積層的卷積核大小為1×1、卷積步長為1;所述第二卷積層的卷積核大小為3×3、卷積步長為2。
5.根據(jù)權(quán)利要求4所述的圖像處理方法,其特征在于,所述第一卷積層、所述第二卷積層和所述第三卷積層中的每個卷積層之前均設(shè)置有一批量歸一化處理層。
6.根據(jù)權(quán)利要求1至5中任一項所述的圖像處理方法,其特征在于,在基于殘差網(wǎng)絡(luò)對所述目標圖像進行特征提取之前,還包括:
初始化所述殘差網(wǎng)絡(luò);
將訓(xùn)練圖像樣本輸入所述殘差網(wǎng)絡(luò)進行迭代訓(xùn)練,直至所述殘差網(wǎng)絡(luò)的損失函數(shù)滿足收斂條件。
7.根據(jù)權(quán)利要求6所述的圖像處理方法,其特征在于,還包括:
獲取所述殘差網(wǎng)絡(luò)中的批量歸一化處理層所包含的學(xué)習(xí)參數(shù);
通過所述學(xué)習(xí)參數(shù)生成所述損失函數(shù)的正則項,并將所述正則項添加至所述損失函數(shù)中。
8.根據(jù)權(quán)利要求7所述的圖像處理方法,其特征在于,將所述正則項添加至所述損失函數(shù)中,包括:
確定所述正則項的系數(shù),所述正則項的系數(shù)的數(shù)量級小于所述殘差網(wǎng)絡(luò)包含的卷積層的權(quán)重的數(shù)量級;
基于所述正則項的系數(shù),將所述正則項添加至所述損失函數(shù)中。
9.根據(jù)權(quán)利要求7所述的圖像處理方法,其特征在于,通過所述學(xué)習(xí)參數(shù)生成所述損失函數(shù)的正則項,包括:
計算所述學(xué)習(xí)參數(shù)的平方和;
將所述平方和的算術(shù)平均值作為所述損失函數(shù)的正則項。
10.根據(jù)權(quán)利要求6所述的圖像處理方法,其特征在于,在將訓(xùn)練圖像樣本輸入所述殘差網(wǎng)絡(luò)進行迭代訓(xùn)練之前,還包括:
獲取用于對殘差網(wǎng)絡(luò)進行訓(xùn)練的樣本圖像;
從所述樣本圖像中截取占所述樣本圖像預(yù)定比例、且寬高比為預(yù)定比值的圖像區(qū)域;
將所述圖像區(qū)域調(diào)整為設(shè)定尺寸的圖像;
對所述設(shè)定尺寸的圖像進行隨機擾動處理,以得到所述訓(xùn)練圖像樣本。
11.根據(jù)權(quán)利要求10所述的圖像處理方法,其特征在于,所述預(yù)定比例為從預(yù)定比例區(qū)間中隨機選取的值,和/或所述預(yù)定比值為從預(yù)定寬高比區(qū)間中隨機選取的值。
12.根據(jù)權(quán)利要求10所述的圖像處理方法,其特征在于,對所述設(shè)定尺寸的圖像進行隨機擾動處理,包括:
以第一處理概率對所述設(shè)定尺寸的圖像進行水平翻轉(zhuǎn)處理;和/或
以第二處理概率對所述設(shè)定尺寸的圖像進行隨機角度的旋轉(zhuǎn)處理,所述隨機角度為從預(yù)定角度區(qū)間中隨機選取的值;和/或
以第三處理概率對所述設(shè)定尺寸的圖像的屬性進行調(diào)整。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于騰訊科技(深圳)有限公司,未經(jīng)騰訊科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810588686.9/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 彩色圖像和單色圖像的圖像處理
 - 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
 - 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
 - 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
 - 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
 - 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
 - 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
 - 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
 - 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
 - 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
 





