[發(fā)明專利]一種目標檢測和語義分割的多任務(wù)并行方法及系統(tǒng)在審
| 申請?zhí)枺?/td> | 202010499259.0 | 申請日: | 2020-06-04 |
| 公開(公告)號: | CN111680739A | 公開(公告)日: | 2020-09-18 |
| 發(fā)明(設(shè)計)人: | 劉陽;孔祥斌;羅靜;胡衛(wèi)明;倪國棟;李兵;楊天驕 | 申請(專利權(quán))人: | 通號通信信息集團有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06K9/46;G06K9/34;G06N3/04;G06N3/08 |
| 代理公司: | 北京紀凱知識產(chǎn)權(quán)代理有限公司 11245 | 代理人: | 孫楠 |
| 地址: | 100070 北京市豐臺區(qū)南*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 目標 檢測 語義 分割 任務(wù) 并行 方法 系統(tǒng) | ||
1.一種目標檢測和語義分割的多任務(wù)并行方法,其特征在于包括以下步驟:
1)根據(jù)錨框投票結(jié)果和檢測真值框計算弱監(jiān)督語義分割標定真值;
2)使用輕量級網(wǎng)絡(luò)結(jié)構(gòu)獲取弱監(jiān)督語義分割結(jié)果;
3)基于弱監(jiān)督語義分割的標定真值和結(jié)果,計算目標檢測與弱監(jiān)督語義分割的損失;
4)根據(jù)目標檢測與弱監(jiān)督語義分割的損失進行反向誤差傳播。
2.如權(quán)利要求1所述多任務(wù)并行方法,其特征在于:所述步驟1)中,根據(jù)目標檢測算法中錨框的投票結(jié)果計算弱監(jiān)督語義分割的錨框投票標定真值,再將所述錨框投票標定真值與直接依靠目標檢測任務(wù)的標定真值框計算出的檢測真值框標定真值進行組合,獲得卷積圖上每個像素點的弱監(jiān)督語義分割標定真值。
3.如權(quán)利要求2所述多任務(wù)并行方法,其特征在于:所述弱監(jiān)督語義分割標定真值的獲取方法包括以下步驟:
1.1)計算卷積圖上每個像素點的弱監(jiān)督語義分割的錨框投票標定真值:弱監(jiān)督語義分割采用二分類模式的輕量級,分別計算當前像素點p屬于前C個前景分類的錨框投票標定真值GA,p,1-C與屬于第C+1個背景分類的錨框投票標定真值GA,p,C+1;
1.2)將弱監(jiān)督語義分割的錨框投票標定真值與檢測真值框標定真值進行組合:
采用以下兩種組合方法:
G1,p,k1=(1-β)·GB,p,k1+β·GA,p,k1
G2,p,k1=(1-β)·GB,p,k1+β·GA,p,k1·GB,p,k1
式中,G1,p,k1與G2,p,k1分別代表第一種和第二種組合方法對于當前像素點p生成的弱監(jiān)督語義分割標定真值中屬于k1類別的數(shù)值,k1∈{1,2};GB,p與GA,p分別代表直接依靠目標檢測標定真值框位置計算出的檢測真值框標定真值,和依靠目標檢測中錨框的分類結(jié)果中蘊含的梯度信息獲得的錨框投票標定真值;系數(shù)β代表弱監(jiān)督語義分割標定真值內(nèi)部,與錨框投票標定真值相關(guān)的部分所占據(jù)的比例。
4.如權(quán)利要求3所述多任務(wù)并行方法,其特征在于:所述步驟1.1)中,當前像素點p屬于前C個前景分類的錨框投票標定真值GA,p,1-C與屬于第C+1個背景分類的錨框投票標定真值GA,p,C+1分別為:
其中,
GA,p,C+1=1-GA,p,1→C
式中,GA,p,1→C代表弱監(jiān)督語義分割中,當前像素點p屬于前C個前景類別的錨框投票標定真值,GA,p,C+1代表像素點p屬于背景類別的錨框投票標定真值;為該像素點p被所有與之相關(guān)的錨框加權(quán)投票后第k個類別的分數(shù),像素點p所有C+1個類別的分數(shù)所組成的集合即為像素點p的錨框投票結(jié)果。
5.如權(quán)利要求3或4所述多任務(wù)并行方法,其特征在于:所述步驟1.1)中,像素點p的錨框投票方法為:將所有在卷積圖上對應(yīng)的區(qū)域能覆蓋像素點p的錨框的所有C+1個類別的分數(shù)按照各個類別分別對位相加,再將對位相加后的各個類別的分數(shù)按照使得C+1個類別的分數(shù)總和為1的要求進行歸一化,將歸一化后的第k個類別的分數(shù)記為像素點p在所述類別的錨框投票分數(shù)
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于通號通信信息集團有限公司,未經(jīng)通號通信信息集團有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010499259.0/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標記或含有代碼標記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合





