[發(fā)明專利]圖像處理方法、裝置、計算機可讀介質及電子設備有效
| 申請?zhí)枺?/td> | 201810588686.9 | 申請日: | 2018-06-08 |
| 公開(公告)號: | CN110163215B | 公開(公告)日: | 2022-08-23 |
| 發(fā)明(設計)人: | 陳衛(wèi)東;吳保元;劉威 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06V10/40 | 分類號: | G06V10/40;G06V10/82;G06N3/04 |
| 代理公司: | 深圳市聯鼎知識產權代理有限公司 44232 | 代理人: | 劉抗美 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 圖像 處理 方法 裝置 計算機 可讀 介質 電子設備 | ||
本發(fā)明的實施例提供了一種圖像處理方法、裝置、計算機可讀介質及電子設備。該圖像處理方法包括:獲取待處理的目標圖像;基于殘差網絡對所述目標圖像進行特征提取,得到圖像特征信息,所述殘差網絡包含順次相連的多個殘差塊,每個所述殘差塊包含卷積分支和殘差分支,所述卷積分支中的第一卷積層的卷積核大小小于位于所述第一卷積層之后的第二卷積層的卷積核大小,所述第二卷積層的卷積步長大于所述第一卷積層的卷積步長且小于所述第二卷積層的卷積核寬度;根據所述圖像特征信息對所述待處理圖像進行識別處理。本發(fā)明實施例的技術方案能夠確保圖像特征提取的準確性,提高了圖像識別的準確率。
技術領域
本發(fā)明涉及計算機技術領域,具體而言,涉及一種圖像處理方法、裝置、計算機可讀介質及電子設備。
背景技術
ResNet(Residual Neural Network,殘差神經網絡)是由何凱明等人提出的神經網絡,ResNet的結構可以極快地加速超深神經網絡的訓練,模型的準確率也有非常大的提升。在圖像處理領域,如何能夠通過ResNet網絡來實現最優(yōu)的圖像處理效果是目前亟待解決的技術問題。
需要說明的是,在上述背景技術部分公開的信息僅用于加強對本發(fā)明的背景的理解,因此可以包括不構成對本領域普通技術人員已知的現有技術的信息。
發(fā)明內容
本發(fā)明實施例的目的在于提供一種圖像處理方法、裝置、計算機可讀介質及電子設備,進而至少在一定程度上確保殘差網絡能夠從圖像中提取出準確的圖像特征,提高圖像的識別準確率。
本發(fā)明的其他特性和優(yōu)點將通過下面的詳細描述變得顯然,或部分地通過本發(fā)明的實踐而習得。
根據本發(fā)明實施例的一個方面,提供了一種圖像處理方法,包括:獲取待處理的目標圖像;基于殘差網絡對所述目標圖像進行特征提取,得到圖像特征信息,所述殘差網絡包含順次相連的多個殘差塊,每個所述殘差塊包含卷積分支和殘差分支,所述卷積分支中的第一卷積層的卷積核大小小于位于所述第一卷積層之后的第二卷積層的卷積核大小,所述第二卷積層的卷積步長大于所述第一卷積層的卷積步長且小于所述第二卷積層的卷積核寬度;根據所述圖像特征信息對所述待處理圖像進行識別處理。
根據本發(fā)明實施例的一個方面,提供了一種圖像處理裝置,包括:第一獲取單元,用于獲取待處理的目標圖像;第一處理單元,用于基于殘差網絡對所述目標圖像進行特征提取,得到圖像特征信息,所述殘差網絡包含順次相連的多個殘差塊,每個所述殘差塊包含卷積分支和殘差分支,所述卷積分支中的第一卷積層的卷積核大小小于位于所述第一卷積層之后的第二卷積層的卷積核大小,所述第二卷積層的卷積步長大于所述第一卷積層的卷積步長且小于所述第二卷積層的卷積核寬度;第二處理單元,用于根據所述圖像特征信息對所述待處理圖像進行識別處理。
在本發(fā)明的一些實施例中,基于前述方案,所述殘差網絡還包含位于所述多個殘差塊之前的初始卷積層,所述初始卷積層的輸出作為所述多個殘差塊中第一個殘差塊的輸入。
在本發(fā)明的一些實施例中,基于前述方案,所述多個殘差塊構成多個卷積階段,每個所述卷積階段中的第一個殘差塊包含的所述殘差分支包含順次相連的一批量歸一化處理層和一目標卷積層。
在本發(fā)明的一些實施例中,基于前述方案,所述卷積分支還包括第三卷積層,所述第一卷積層、所述第二卷積層和所述第三卷積層順次相連;其中,所述第一卷積層和所述第三卷積層的卷積核大小為1×1、卷積步長為1;所述第二卷積層的卷積核大小為3×3、卷積步長為2。
在本發(fā)明的一些實施例中,基于前述方案,所述第一卷積層、所述第二卷積層和所述第三卷積層中的每個卷積層之前均設置有一批量歸一化處理層。
在本發(fā)明的一些實施例中,基于前述方案,所述的圖像處理裝置還包括:初始化單元,用于初始化所述殘差網絡;訓練單元,用于將訓練圖像樣本輸入所述殘差網絡進行迭代訓練,直至所述殘差網絡的損失函數滿足收斂條件。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810588686.9/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





