[發(fā)明專利]一種目標提取方法及裝置在審
| 申請?zhí)枺?/td> | 202010952509.1 | 申請日: | 2020-09-11 |
| 公開(公告)號: | CN112070793A | 公開(公告)日: | 2020-12-11 |
| 發(fā)明(設(shè)計)人: | 王曉茹;徐培容;曲昭偉;張珩;谷嘉航 | 申請(專利權(quán))人: | 北京郵電大學(xué) |
| 主分類號: | G06T7/194 | 分類號: | G06T7/194;G06T7/66;G06K9/38;G06K9/62;G06N3/04 |
| 代理公司: | 北京集佳知識產(chǎn)權(quán)代理有限公司 11227 | 代理人: | 尹秀 |
| 地址: | 100876 *** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 目標 提取 方法 裝置 | ||
1.一種目標提取方法,其特征在于,包括:
獲取待提取目標的圖像和位置信息;所述位置信息包括前景點的位置信息和背景點的位置信息;
依據(jù)所述前景點的位置信息計算前景二值圖像;
依據(jù)所述背景點的位置信息計算背景二值圖像;
將所述圖像、所述前景二值圖像和所述背景二值圖像進行通道組合,得到通道組合后的圖像;
將所述通道組合后的圖像輸入訓(xùn)練后的目標語義分割模型,得到用于區(qū)分所述圖像中的目標和非目標的掩膜;所述目標語義分割模型是至少將Deeplab v3+語義分割網(wǎng)絡(luò)中的Xception-65替換為殘差網(wǎng)絡(luò)ResNet-101得到;
依據(jù)所述掩膜和所述圖像,提取所述圖像中的目標。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述依據(jù)所述前景點的位置信息計算前景二值圖像,包括:
在所述圖像中,分別以每個前景點為圓心,以預(yù)設(shè)半徑作圓,得到每個所述前景點對應(yīng)的圓;
將每個所述前景點對應(yīng)的圓所在的區(qū)域的像素點的像素值設(shè)置為1,將所述前景點對應(yīng)的圓之外的像素點的像素值設(shè)置為0,得到所述前景二值圖像。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述依據(jù)所述背景點的位置信息計算背景二值圖像,包括:
在所述圖像中,分別以每個背景點為圓心,以所述預(yù)設(shè)半徑作圓,得到每個所述背景點對應(yīng)的圓;
將每個所述背景點對應(yīng)的圓所在的區(qū)域的像素點的像素值設(shè)置為1,將所述背景點對應(yīng)的圓之外的像素點的像素值設(shè)置為0,得到所述背景二值圖像。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述目標語義分割網(wǎng)絡(luò)的最終輸出網(wǎng)絡(luò)的通道數(shù)為2;
所述掩膜包括第一掩膜和第二掩膜;所述第一掩膜中任一位置點的取值表示所述圖像中與該位置點相同的像素點屬于所述目標的概率;所述第二掩膜中任一位置點的取值表示所述圖像中與該位置點相同的像素點屬于所述非目標的概率;
所述依據(jù)所述掩膜和所述圖像,提取所述圖像中的所述目標,包括:
對所述第一掩膜和所述第二掩膜中的目標位置點的取值進行比較,得到比較結(jié)果;所述目標位置點為相同位置點;
在所述比較結(jié)果表示:所述第一掩膜中所述目標位置點的取值大于所述第二掩膜中所述目標位置點的取值的情況下,則將所述圖像中所述目標位置點指示的像素點作為目標像素點;
將所述圖像中所述目標像素點組成的區(qū)域,作為所述目標。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述圖像為RGB圖像;所述殘差網(wǎng)絡(luò)ResNet-101的輸入通道數(shù)為5。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,對所述目標語義分割模型的訓(xùn)練過程,包括:
獲取訓(xùn)練樣本和樣本標簽;任意一個所述訓(xùn)練樣本為由RGB原始圖像、前景二值圖像和背景二值圖像通過通道組合得到;該訓(xùn)練樣本的樣本標簽為用于區(qū)分目標和非目標的2通道掩膜;
采用所述訓(xùn)練樣本、所述樣本標簽和目標損失函數(shù),對所述目標語義分割模型進行訓(xùn)練,得到訓(xùn)練后的目標語義分割模型;所述目標損失函數(shù)為預(yù)設(shè)的標記損失函數(shù)和交叉熵之和;所述標記損失函數(shù)的表達式為:
所述LabelLoss表示標記損失函數(shù)值,L表示目標語義分割模型對輸入的任一訓(xùn)練樣本輸出的結(jié)果掩膜中的非目標掩膜,S1表示該訓(xùn)練樣本中的前景二值圖像,S0表示該訓(xùn)練樣本中的背景二值圖像,W表示所述RGB原始圖像的寬度,H表示所述RGB原始圖像的高度。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京郵電大學(xué),未經(jīng)北京郵電大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010952509.1/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





