[發明專利]特征提取方法、圖像處理方法、模型訓練方法及裝置有效
| 申請號: | 201910011794.4 | 申請日: | 2019-01-07 |
| 公開(公告)號: | CN111414922B | 公開(公告)日: | 2022-11-15 |
| 發明(設計)人: | 王永攀;鄭琪;許永超;黃騰騰;白翔;柏松 | 申請(專利權)人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | G06V10/40 | 分類號: | G06V10/40;G06V10/74;G06V10/80;G06V10/82;G06N3/08 |
| 代理公司: | 北京太合九思知識產權代理有限公司 11610 | 代理人: | 曹威 |
| 地址: | 英屬開曼群島大開*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 特征 提取 方法 圖像 處理 模型 訓練 裝置 | ||
本申請實施例提供一種特征提取方法、圖像處理方法、模型訓練方法及裝置,其中,神經網絡模型中插入至少一個特征層,該特征層可以根據其連接的前一網絡層輸出的第一圖像特征,計算任意像素點與其所在目標區域內的至少一個像素點的特征相似度,并根據所述任意像素點與所述至少一個像素點的特征相似度,將所述任意像素點的第一像素特征與所述至少一個像素點的第一像素特征進行融合,獲得所述任意像素點的第二像素特征,并由所述多個像素點的第二像素特征構成所述特征層輸出的第二圖像特征,以及將所述第二圖像特征輸入所述特征層連接的后一網絡層;本申請實施例提高了圖像識別準確度。
技術領域
本申請實施例涉及圖像處理技術領域,尤其涉及特征提取方法、圖像處理方法、模型訓練方法以及裝置。
背景技術
利用神經網絡模型進行圖像識別是目前人工智能領域常用的技術手段,圖像識別是指識別圖像中的目標對象或者實現對圖像中的目標對象的分割,如基于人體組成結構,進行人體分割等。
其中,利用神經網絡模型進行圖像識別需要預先訓練神經網絡模型,主要是利用樣本圖像及樣本圖像標注的標簽進行訓練,以實現人體分割為例,訓練神經網絡模型時,樣本圖像標注的標簽包括樣本圖像中各個像素點的標簽,各個像素點的標簽用以表明各個像素點所屬的人體組成部位,從而利用訓練好的神經網絡模型對待處理圖像進行處理時,獲得的識別結果即為待處理圖像中各個像素點的分類結果,也即各個像素點的標簽,從而根據各個像素點的標簽表明的人體組成部位,即可以實現對待處理圖像的分割。
但是,目前的神經網絡模型進行圖像識別時會出現不一致性問題,也即提取的目標對象容易出現彌散或色斑現象,目標對象的相鄰部位沒有緊密連接,分割邊界不清晰等,從而影響圖像識別準確度。
發明內容
本申請實施例提供一種特征提取方法、圖像處理方法、模型訓練方法及裝置,用以解決現有技術中圖像識別準確度低的技術問題。
第一方面,本申請實施例中提供了一種特征提取方法,包括:
接收神經網絡模型中特征層連接的前一網絡層輸出的第一圖像特征;其中,所述第一圖像特征包括多個像素點的第一像素特征;所述特征層位于神經網絡模型的輸入層以及輸出層之間;
根據任意像素點與其所在目標區域內的至少一個像素點的特征相似度,將所述任意像素點的第一像素特征與所述至少一個像素點的第一像素特征進行融合,獲得所述任意像素點的第二像素特征;
由所述多個像素點的第二像素特征構成所述特征層輸出的第二圖像特征;其中,所述第二圖像特征用于輸入所述特征層連接的后一網絡層。
第二方面,本申請實施例中提供了一種模型訓練方法,包括:
將樣本圖像輸入神經網絡模型,獲得實際識別結果;其中,所述神經網絡模型包括輸入層、輸出層、位于所述輸入層以及所述輸出層之間的至少一個隱藏層及至少一個特征層構成;所述特征層用以根據其連接的前一網絡層輸出的第一圖像特征,計算任意像素點與其所在目標區域內的至少一個像素點的特征相似度,并根據所述任意像素點與所述至少一個像素點的特征相似度,將所述任意像素點的第一像素特征與所述至少一個像素點的第一像素特征進行融合,獲得所述任意像素點的第二像素特征,并由所述多個像素點的第二像素特征構成所述特征層輸出的第二圖像特征,以及將所述第二圖像特征輸入與所述特征層連接的后一網絡層;
根據所述實際識別結果與所述樣本圖像的期望識別結果,對所述神經網絡模型進行參數優化;
其中,所述神經網絡模型用以識別待處理圖像。
第三方面,本申請實施例中提供了一種圖像處理方法,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于阿里巴巴集團控股有限公司,未經阿里巴巴集團控股有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910011794.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:混合現實系統、氣味提供方法以及用戶設備
- 下一篇:數據傳輸方法及通信設備
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





