[發(fā)明專利]圖像的區(qū)域定位方法和目標(biāo)區(qū)域定位模型的訓(xùn)練方法在審

申請?zhí)枺?/td>	201911004758.1	申請日：	2019-10-22
公開（公告）號：	CN110766027A	公開（公告）日：	2020-02-07
發(fā)明（設(shè)計）人：	葉燕罡;陳銘良;沈小勇	申請（專利權(quán)）人：	騰訊科技(深圳)有限公司
主分類號：	G06K9/46	分類號：	G06K9/46;G06K9/62
代理公司：	44224 廣州華進聯(lián)合專利商標(biāo)代理有限公司	代理人：	董慧
地址：	518000 廣東省深圳***	國省代碼：	廣東;44
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	樣本圖像目標(biāo)區(qū)域初始定位定位模型區(qū)域定位激活注意力集中定位結(jié)果模型參數(shù) 目標(biāo)類別目標(biāo)類型訓(xùn)練目標(biāo) 遺漏圖像申請
鉆瓜網(wǎng) 技術(shù)展會專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【說明書】：

本申請涉及一種圖像的區(qū)域定位方法和目標(biāo)區(qū)域定位模型的訓(xùn)練方法，其中，目標(biāo)區(qū)域定位模型為使用屬于目標(biāo)類別的樣本圖像集訓(xùn)練初始定位模型，在訓(xùn)練目標(biāo)區(qū)域定位模型時，通過初始定位模型分別對樣本圖像集中的各樣本圖像進行處理，獲得各樣本圖像對應(yīng)的類激活圖，當(dāng)根據(jù)各樣本圖像的類激活圖確定的目標(biāo)區(qū)域未完全覆蓋相應(yīng)樣本圖像中與目標(biāo)類型相關(guān)的區(qū)域時，則繼續(xù)使用樣本圖像對初始定位模型的模型參數(shù)進行調(diào)整，以引導(dǎo)當(dāng)前的模型將更多注意力集中在該樣本圖像中被遺漏的目標(biāo)區(qū)域，從而在調(diào)整的過程中查漏補缺，使得獲得的目標(biāo)區(qū)域定位模型的定位結(jié)果更加準(zhǔn)確。

技術(shù)領(lǐng)域

本申請涉及計算機技術(shù)領(lǐng)域，特別是涉及一種圖像的區(qū)域定位方法、目標(biāo)區(qū)域定位模型的訓(xùn)練方法、裝置、計算機可讀存儲介質(zhì)和計算機設(shè)備。

背景技術(shù)

計算機視覺(Computer Vision)有許多不同的應(yīng)用，比如圖像分類和圖像定位等等。圖像分類與圖像定位的區(qū)別是圖像分類只需要通過計算機模型預(yù)測圖像所屬的類別，也就是預(yù)測圖像中的具體目標(biāo)；而圖像定位是通過計算機模型識別出圖像中的具體目標(biāo)并定位該目標(biāo)在圖像中的位置的技術(shù)。因此，對于監(jiān)督式學(xué)習(xí)而言，圖像分類的訓(xùn)練數(shù)據(jù)僅僅需要對樣本圖像的類別進行標(biāo)注即可，而圖像定位則需要標(biāo)注目標(biāo)在圖像中的位置及目標(biāo)類別，顯然圖像定位所需要的訓(xùn)練數(shù)據(jù)的標(biāo)注成本更高。

現(xiàn)有的通過利用神經(jīng)網(wǎng)絡(luò)進行圖像定位的方法，由于訓(xùn)練數(shù)據(jù)的標(biāo)注成本問題，通常僅利用圖像的類別信息對圖像進行目標(biāo)區(qū)域定位，由于缺少目標(biāo)區(qū)域的監(jiān)督信息，導(dǎo)致效果較差、定位不準(zhǔn)確。

發(fā)明內(nèi)容

基于此，有必要針對現(xiàn)有技術(shù)中利用圖像的類別信息進行圖像定位的方式存在定位效果不準(zhǔn)確的技術(shù)問題，提供一種圖像的區(qū)域定位方法、目標(biāo)區(qū)域定位模型的訓(xùn)練方法、裝置、計算機可讀存儲介質(zhì)和計算機設(shè)備。

一種圖像的區(qū)域定位方法，包括：

獲取待處理圖像；

通過目標(biāo)區(qū)域定位模型獲取所述待處理圖像對應(yīng)的類激活圖；

其中，所述目標(biāo)區(qū)域定位模型是使用屬于目標(biāo)類別的樣本圖像集訓(xùn)練初始定位模型時，當(dāng)根據(jù)各樣本圖像的類激活圖確定的目標(biāo)區(qū)域未完全覆蓋相應(yīng)樣本圖像中與所述目標(biāo)類別相關(guān)的區(qū)域時，則繼續(xù)使用所述樣本圖像對所述初始定位模型的模型參數(shù)進行調(diào)整得到的，各所述樣本圖像對應(yīng)的類激活圖是通過所述初始定位模型對所述樣本圖像進行處理獲得的；

根據(jù)所述待處理圖像對應(yīng)的類激活圖確定所述待處理圖像中的目標(biāo)區(qū)域。

一種圖像的區(qū)域定位裝置，所述裝置包括：

圖像獲取模塊，用于獲取待處理圖像；

類激活圖獲取模塊，用于通過目標(biāo)區(qū)域定位模型獲取所述待處理圖像對應(yīng)的類激活圖；其中，所述目標(biāo)區(qū)域定位模型是使用屬于目標(biāo)類別的樣本圖像集訓(xùn)練初始定位模型時，當(dāng)根據(jù)各樣本圖像的類激活圖確定的目標(biāo)區(qū)域未完全覆蓋相應(yīng)樣本圖像中與所述目標(biāo)類別相關(guān)的區(qū)域時，則繼續(xù)使用所述樣本圖像對所述初始定位模型的模型參數(shù)進行調(diào)整得到的，各所述樣本圖像對應(yīng)的類激活圖是通過所述初始定位模型對所述樣本圖像進行處理獲得的；

目標(biāo)區(qū)域確定模塊，用于根據(jù)所述待處理圖像對應(yīng)的類激活圖確定所述待處理圖像中的目標(biāo)區(qū)域。

一種計算機可讀存儲介質(zhì)，存儲有計算機程序，所述計算機程序被處理器執(zhí)行時，使得所述處理器執(zhí)行上述圖像的區(qū)域定位方法的步驟。

一種計算機設(shè)備，包括存儲器和處理器，所述存儲器存儲有計算機程序，所述計算機程序被所述處理器執(zhí)行時，使得所述處理器執(zhí)行上述圖像的區(qū)域定位方法的步驟。

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于騰訊科技(深圳)有限公司，未經(jīng)騰訊科技(深圳)有限公司許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201911004758.1/2.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

上一篇：一種快速識別卡號的方法及裝置、模型訓(xùn)練方法及裝置
下一篇：像素類型確定方法及裝置

同類專利

專利分類

G 物理

G06 計算；推算；計數(shù)
G06K 數(shù)據(jù)識別；數(shù)據(jù)表示；記錄載體；記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形，例如，指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正，例如，用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的，例如，由不同形狀的各個筆畫組成的，而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理，即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實用新型專利、外觀設(shè)計專利（升級中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】