[發明專利]圖像特征提取方法、裝置、電子設備及存儲介質在審
| 申請號: | 201811561327.0 | 申請日: | 2018-12-19 |
| 公開(公告)號: | CN111340059A | 公開(公告)日: | 2020-06-26 |
| 發明(設計)人: | 趙元;尹程翔;伍林;唐劍;沈海峰 | 申請(專利權)人: | 北京嘀嘀無限科技發展有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/04 |
| 代理公司: | 北京超成律師事務所 11646 | 代理人: | 鄧超 |
| 地址: | 100193 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 圖像 特征 提取 方法 裝置 電子設備 存儲 介質 | ||
本申請實施例提供一種圖像特征提取方法、裝置、電子設備及存儲介質,屬于圖像技術領域。該方法通過對待處理圖像提取的M個不同層級特征進行兩次處理后,獲得M層第一中間特征和M層第二中間特征,然后再將這M層第一中間特征和M層第二中間特征進行融合,獲得的M層圖像特征,通過該方式獲得的每層圖像特征中可以包含信息較為均衡的M個不同層級特征,即每層圖像特征中包括信息比較均衡的高層信息和低層信息,由于低層信息對于某些細節信息比較敏感,能夠提供對定位和分割較為有益的信息,通過上述對特征的多次處理,讓高層網絡更容易、更全面地獲取低層信息,從而可以使得高層信息與低層信息更為均衡,實現對大小物體均衡的分割效果。
技術領域
本申請涉及圖像技術領域,具體而言,涉及一種圖像特征提取方法、裝置、電子設備及存儲介質。
背景技術
實例分割是計算機視覺領域非常重要的方向,其在無人駕駛、家居機器人等領域有著非常廣闊的應用。此任務結合了語義分割和物體檢測的特點,而對于輸入圖像的每一個物體,都會為每一個物體生成一個獨立的像素級別的掩膜,并且預測其對應的類別,所以,為了對輸入圖像中的每個物體進行更好的預測,現有技術中通過對輸入的圖像進行特征提取,然后利用現有的掩膜區域卷積神經網絡(Mask Region-Convolutional NeuralNetwork,Mask R-CNN)的特征金字塔網絡(feature pyramid networks,FPN)結構對提取的特征進行融合,最后獲得的特征中包括的高層信息較多,而由于高層信息對大物體的識別效果較好,但是低層信息對小物體的識別效果較好,所以,通過上述方式最后獲得的特征包含的高層信息與低層信息不均衡,使得后續利用該最后獲得的特征進行實例分割時對大小物體的識別效果相差較大。
發明內容
本申請實施例的目的在于提供一種圖像特征提取方法、裝置、電子設備及存儲介質,以使高層網絡更容易、更全面地獲取低層信息,從而可以使得高層信息與低層信息更為均衡,實現對大小物體均衡的分割效果。
第一方面,本申請實施例提供了一種圖像特征提取方法,所述方法包括:獲取待處理圖像,對所述待處理圖像進行特征提取,獲得M個不同層級特征,M為大于等于2的整數;將所述M個不同層級特征按照第一層級方向進行處理,獲得M層第一中間特征,以及將所述M個不同層級特征按照與所述第一層級方向相反的第二層級方向進行處理,獲得M層第二中間特征;將所述M層第一中間特征及所述M層第二中間特征進行處理,獲得M層圖像特征。
在上述實現過程中,通過對待處理圖像提取的M個不同層級特征進行兩次處理后,獲得M層第一中間特征和M層第二中間特征,然后再將這M層第一中間特征和M層第二中間特征進行融合,獲得的M層圖像特征,通過該方式獲得的每層圖像特征中可以包含信息較為均衡的M個不同層級特征,即每層圖像特征中包括信息比較均衡的高層信息和低層信息,由于低層信息對于某些細節信息比較敏感,能夠提供對定位和分割較為有益的信息,通過上述對特征的多次處理,讓高層網絡更容易、更全面地獲取低層信息,從而可以使得高層信息與低層信息更為均衡,實現對大小物體均衡的分割效果。
可選地,所述M個不同層級特征中第i個層級特征的級別小于第i+1層級特征的級別,將所述M層第一中間特征及所述M層第二中間特征進行處理,獲得M層圖像特征,包括:將第1層第一中間特征確定為所述M層圖像特征中的第1層圖像特征;依次取i為2至M,將第i層第一中間特征與第i-1層第二中間特征進行融合,獲得第i層圖像特征,在i為M時,共獲得M-1層圖像特征。
在上述實現過程中,對M層第一中間特征和M層第二中間特征進行上述處理后獲得的M層圖像特征,使得M層圖像特征中包括第1層第一中間特征以及每次對M層第一中間特征和M層第二中間特征進行融合后的融合特征,通過上述對特征的多次處理,讓高層網絡更容易、更全面地獲取低層信息,從而可以使得高層信息與低層信息更為均衡,實現對大小物體均衡的分割效果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京嘀嘀無限科技發展有限公司,未經北京嘀嘀無限科技發展有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811561327.0/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





