[發(fā)明專利]一種基于圖像分割技術(shù)的圖像局部特征的提取方法有效
| 申請?zhí)枺?/td> | 201810336591.8 | 申請日: | 2018-04-16 |
| 公開(公告)號: | CN108921850B | 公開(公告)日: | 2022-05-17 |
| 發(fā)明(設(shè)計)人: | 張雷;陳杰 | 申請(專利權(quán))人: | 博云視覺(北京)科技有限公司 |
| 主分類號: | G06T7/10 | 分類號: | G06T7/10 |
| 代理公司: | 北京科家知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11427 | 代理人: | 陳娟 |
| 地址: | 100036 北京市海淀區(qū)太平路2*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 圖像 分割 技術(shù) 局部 特征 提取 方法 | ||
本發(fā)明公開了一種基于圖像分割技術(shù)的圖像局部特征的提取方法,包括以下步驟:1、構(gòu)建圖像分割模型;2、圖像輸入CNN網(wǎng)絡(luò),獲得多層的特征圖,在經(jīng)過多個卷積層及池化降采樣之后,得到了特征圖以及對應(yīng)每張?zhí)卣鲌D降采樣時原本像素所在位置的信息;3、將特征圖通過上采樣模塊向上采樣,重新將像素分配到原本的位置;4、對新產(chǎn)生的特征圖上每個像素位置計算softmax損失;5、不斷迭代上述過程,直到回傳的損失值小到接受范圍內(nèi),完成圖像分割模型的構(gòu)建與訓(xùn)練的過程;6、通過訓(xùn)練特征提取網(wǎng)絡(luò)完成圖像局部特征的提取。本發(fā)明可以實現(xiàn)不同程度的精準(zhǔn)檢索,精準(zhǔn)定位目標(biāo)以及目標(biāo)部位,從而提取關(guān)鍵部位特征進(jìn)行細(xì)致的特征比對。
技術(shù)領(lǐng)域
本發(fā)明涉及圖像處理技術(shù)領(lǐng)域,尤其涉及一種基于圖像分割技術(shù)的圖像局部特征的提取方法。
背景技術(shù)
圖像檢索是利用圖像搜索相似圖像或同一目標(biāo)圖像的過程。精準(zhǔn)檢索就要求搜索到的圖像都是同一目標(biāo)的圖像,而不是相似目標(biāo)。圖像檢索的流程包括圖像特征的提取,圖像特征的入庫,特征的對比,按相似度對輸出結(jié)果進(jìn)行排序。市面上圖像檢索的方法很多,其中主要的創(chuàng)新都聚焦在圖像特征的提取方式,特征的對比方式以及最后的輸出結(jié)果的排序方法。本發(fā)明的關(guān)鍵是利用圖像分割技術(shù),深度模型去對圖像或目標(biāo)進(jìn)行像素級別的分割,精準(zhǔn)定位目標(biāo)位置(行人,車輛在圖像的位置)或目標(biāo)部分(人的軀干,四肢)的位置,針對這些位置來對應(yīng)的提取特征,對部分特征的對比可以細(xì)致的分辨出是否為同一目標(biāo),相比于全局特征,這樣的局部特征包含的細(xì)節(jié)信息更多,更有助于目標(biāo)的區(qū)分。
大部分現(xiàn)有技術(shù)的特征提取方案是基于全局特征進(jìn)行的,細(xì)致一點的局部特征也很少有針對像素級別的特征提取,基本都是使用圖像梯度或者使用框選的圖像塊的方法去進(jìn)行局部特征的提取。在相似圖像的圖像檢索任務(wù)中,這樣的特征基本可以滿足任務(wù)的要求,但是細(xì)致到檢索同一目標(biāo)的檢索任務(wù)時,這樣的特征也不能很好的滿足任務(wù)要求。
另外,在進(jìn)行檢索任務(wù)時,檢索圖像一般要求輸入圖像是只包含目標(biāo)圖像的圖像,或者輸入全圖(包含各種場景和目標(biāo)的圖)后,在做檢索前要進(jìn)行一次檢測,才能對目標(biāo)進(jìn)行圖像檢索。
發(fā)明內(nèi)容
有鑒于現(xiàn)有技術(shù)的上述缺陷,本發(fā)明所要解決的技術(shù)問題是提供一種基于圖像分割技術(shù)的圖像局部特征的提取方法,以解決現(xiàn)有技術(shù)的不足。
為實現(xiàn)上述目的,本發(fā)明提供了一種基于圖像分割技術(shù)的圖像局部特征的提取方法,包括以下步驟:
步驟1、構(gòu)建圖像分割模型,分割模型由多個不同功能的網(wǎng)絡(luò)層組成,包括CNN模型結(jié)構(gòu)、batchnorm層結(jié)構(gòu)、deconv層結(jié)構(gòu);
步驟2、圖像輸入CNN網(wǎng)絡(luò),獲得多層的特征圖,在經(jīng)過多個卷積層及池化降采樣之后,得到了特征圖以及對應(yīng)每張?zhí)卣鲌D降采樣時原本像素所在位置的信息;
步驟3、將特征圖通過上采樣模塊向上采樣,根據(jù)之前每層特征圖上像素原本的位置信息,重新將像素分配到原本的位置,使產(chǎn)生的特征圖和原始輸入圖像的特征保持一致;
步驟4、對新產(chǎn)生的特征圖上每個像素位置計算softmax損失,對每一個像素點的位置進(jìn)行分類,通過比較手工標(biāo)注的圖像標(biāo)簽與網(wǎng)絡(luò)輸出的結(jié)果,計算出針對每個像素位置的損失,通過回傳損失,訓(xùn)練模型中的參數(shù);
步驟5、不斷迭代上述過程,直到回傳的損失值小到接受范圍內(nèi),完成圖像分割模型的構(gòu)建與訓(xùn)練的過程;
步驟6、完成圖像分割模型的構(gòu)建與訓(xùn)練的過程后,通過訓(xùn)練特征提取網(wǎng)絡(luò),根據(jù)上一個分割網(wǎng)絡(luò)的輸出圖像,對原始圖像提取不同部位的特征,完成圖像局部特征的提取。
上述的一種基于圖像分割技術(shù)的圖像局部特征的提取方法,所述步驟6的特征提取網(wǎng)絡(luò)包括模型構(gòu)建部分和特征訓(xùn)練部分。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于博云視覺(北京)科技有限公司,未經(jīng)博云視覺(北京)科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810336591.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





