[發(fā)明專利]對圖片進(jìn)行目標(biāo)采樣的方法及裝置有效
| 申請?zhí)枺?/td> | 201811046061.6 | 申請日: | 2018-09-07 |
| 公開(公告)號: | CN110569699B | 公開(公告)日: | 2020-12-29 |
| 發(fā)明(設(shè)計)人: | 徐娟 | 申請(專利權(quán))人: | 創(chuàng)新先進(jìn)技術(shù)有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/32;G06K9/62;G06K9/46 |
| 代理公司: | 北京億騰知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11309 | 代理人: | 陳霽;周良玉 |
| 地址: | 開曼群島大開曼島*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 圖片 進(jìn)行 目標(biāo) 采樣 方法 裝置 | ||
本說明書實施例提供一種計算機執(zhí)行的對圖片進(jìn)行目標(biāo)采樣的方法和裝置,根據(jù)該方法的一個實施方式,首先獲取預(yù)先通過人工對目標(biāo)進(jìn)行標(biāo)注的圖片,其中,圖片中通過最大標(biāo)注邊框包圍目標(biāo)的最大連續(xù)區(qū)域,通過多個子標(biāo)注邊框分別包圍目標(biāo)的部分連續(xù)區(qū)域,然后,在最大標(biāo)注邊框內(nèi),按照預(yù)定采樣邊框確定候選采樣區(qū)域,接著,將候選采樣區(qū)域與各個子標(biāo)注邊框所包圍的各個區(qū)域依次進(jìn)行重疊狀況的對比,從而確定對應(yīng)的重疊參數(shù),并在重疊參數(shù)滿足預(yù)定條件的情況下,將候選采樣區(qū)域采樣為用于訓(xùn)練目標(biāo)檢測模型的正樣本。該實施方式可以提高對目標(biāo)進(jìn)行正樣本采樣的有效性。
技術(shù)領(lǐng)域
本說明書一個或多個實施例涉及計算機技術(shù)領(lǐng)域,尤其涉及通過計算機對圖片進(jìn)行目標(biāo)采樣的方法和裝置。
背景技術(shù)
圖像識別技術(shù)是人工智能的一個重要領(lǐng)域,它是指對圖像進(jìn)行對象識別,以識別各種不同模式的目標(biāo)和對象的技術(shù)。在一個事物包括多個部件的情況下,還可以包括對該事物中各個部件的識別。例如,對人臉圖片中的五官的識別、車輛圖片中各個車輛部件的識別等等。
在對圖像中的目標(biāo)對象進(jìn)行識別的過程中,往往需要預(yù)先通過一定數(shù)量的正樣本和負(fù)樣本訓(xùn)練目標(biāo)檢測模型。不過,目前對許多場景下的目標(biāo)檢測訓(xùn)練的采樣效果不夠理想。例如,對于智能車輛定損場景下的車輛損傷對象的目標(biāo)檢測,需要大量的包含損傷對象的樣本作為正樣本,以及不含損傷對象的樣本作為負(fù)樣本。然而,常規(guī)技術(shù)中,往往出現(xiàn)正樣本采樣不足,以及負(fù)樣本中包含部分損傷對象因而存在大量噪聲干擾的問題。因此,需要提供一種方法,提高正樣本采樣的有效性。
發(fā)明內(nèi)容
本說明書一個或多個實施例描述了一種計算機執(zhí)行的對圖片進(jìn)行目標(biāo)采樣的方法和裝置,可以通過在包圍目標(biāo)的最大連續(xù)區(qū)域內(nèi)采集正樣本,大大提高對目標(biāo)正樣本采樣的有效性。
根據(jù)第一方面,提供了一種計算機執(zhí)行的對圖片進(jìn)行目標(biāo)采樣的方法,包括:獲取用于對目標(biāo)進(jìn)行采樣的圖片,其中,所述圖片至少包括預(yù)先人工標(biāo)注的最大標(biāo)注邊框和位于所述最大標(biāo)注邊框內(nèi)的多個子標(biāo)注邊框,所述最大標(biāo)注邊框用于包圍所述目標(biāo)的最大連續(xù)區(qū)域,所述多個子標(biāo)注邊框分別包圍所述目標(biāo)的部分連續(xù)區(qū)域;在所述最大標(biāo)注邊框內(nèi),按照預(yù)定采樣邊框確定候選采樣區(qū)域,其中,所述預(yù)定采樣邊框包括具有預(yù)定大小和預(yù)定形狀的邊框;根據(jù)所述候選采樣區(qū)域與各個子標(biāo)注邊框所包圍的各個區(qū)域之間的重疊狀況,確定對應(yīng)的重疊參數(shù);在所述重疊參數(shù)滿足預(yù)定條件的情況下,將所述候選采樣區(qū)域采樣為用于訓(xùn)練目標(biāo)檢測模型的正樣本。
根據(jù)一方面的實施方式,所述在所述最大標(biāo)注邊框內(nèi),按照預(yù)定采樣邊框確定候選采樣區(qū)域包括:從所述最大標(biāo)注邊框中確定所述預(yù)定采樣邊框的起始位置;將所述預(yù)定采樣邊框按照預(yù)設(shè)的移動規(guī)則從起始位置移動,以將所述預(yù)定采樣邊框當(dāng)前包圍的區(qū)域確定為所述候選采樣區(qū)域。
根據(jù)另一方面的實施方式,所述在所述最大標(biāo)注邊框內(nèi),按照預(yù)定采樣邊框確定候選采樣區(qū)域包括:隨機確定所述預(yù)定采樣邊框在所述最大標(biāo)注邊框中的位置;將所述預(yù)定采樣邊框包圍的區(qū)域確定為所述候選采樣區(qū)域。
在一個實施例中,根據(jù)所述候選采樣區(qū)域與各個子標(biāo)注邊框所包圍的各個區(qū)域之間的重疊狀況,確定對應(yīng)的重疊參數(shù)包括:針對所述多個子標(biāo)注邊框中任意一個子標(biāo)注邊框所包圍的第一區(qū)域,獲取所述候選采樣區(qū)域與所述第一區(qū)域的重疊區(qū)域,以及所述候選采樣區(qū)域與所述第一區(qū)域的總包圍區(qū)域;將所述重疊區(qū)域與所述總包圍區(qū)域的第一面積比作為所述重疊參數(shù)。
進(jìn)一步地,根據(jù)一個實施例,所述預(yù)定條件包括,所述候選采樣區(qū)域與任意一個上述子標(biāo)注邊框之間的所述重疊參數(shù)落入預(yù)定范圍。
根據(jù)另一種可能的設(shè)計,所述方法還包括:在所述最大標(biāo)注邊框外,按照所述預(yù)定采樣邊框確定采樣區(qū)域,以作為用于訓(xùn)練目標(biāo)檢測模型的負(fù)樣本。
在一個實施例中,所述圖片為包含車輛損傷的圖片,所述目標(biāo)為連續(xù)損傷。
在一個實施例中,所述多個子標(biāo)注區(qū)域相互之間沒有重疊。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于創(chuàng)新先進(jìn)技術(shù)有限公司,未經(jīng)創(chuàng)新先進(jìn)技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811046061.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 目標(biāo)檢測裝置、學(xué)習(xí)裝置、目標(biāo)檢測系統(tǒng)及目標(biāo)檢測方法
- 目標(biāo)監(jiān)測方法、目標(biāo)監(jiān)測裝置以及目標(biāo)監(jiān)測程序
- 目標(biāo)監(jiān)控系統(tǒng)及目標(biāo)監(jiān)控方法
- 目標(biāo)跟蹤方法和目標(biāo)跟蹤設(shè)備
- 目標(biāo)跟蹤方法和目標(biāo)跟蹤裝置
- 目標(biāo)檢測方法和目標(biāo)檢測裝置
- 目標(biāo)跟蹤方法、目標(biāo)跟蹤裝置、目標(biāo)跟蹤設(shè)備
- 目標(biāo)處理方法、目標(biāo)處理裝置、目標(biāo)處理設(shè)備及介質(zhì)
- 目標(biāo)處理方法、目標(biāo)處理裝置、目標(biāo)處理設(shè)備及介質(zhì)
- 目標(biāo)跟蹤系統(tǒng)及目標(biāo)跟蹤方法





