[發(fā)明專利]訓(xùn)練數(shù)據(jù)的生成方法、對(duì)象檢測(cè)模型的訓(xùn)練方法和裝置在審
| 申請(qǐng)?zhí)枺?/td> | 201811382077.4 | 申請(qǐng)日: | 2018-11-19 |
| 公開(公告)號(hào): | CN109544496A | 公開(公告)日: | 2019-03-29 |
| 發(fā)明(設(shè)計(jì))人: | 金鑫;魏秀參;謝煙平;趙博睿 | 申請(qǐng)(專利權(quán))人: | 南京曠云科技有限公司;徐州曠視數(shù)據(jù)科技有限公司;北京曠視科技有限公司 |
| 主分類號(hào): | G06T5/50 | 分類號(hào): | G06T5/50;G06K9/62 |
| 代理公司: | 北京超凡志成知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11371 | 代理人: | 李強(qiáng) |
| 地址: | 210000 江蘇省南京市*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 訓(xùn)練數(shù)據(jù) 合成 圖數(shù)據(jù) 對(duì)象檢測(cè) 方法和裝置 背景圖像 圖像數(shù)據(jù) 圖像 圖像數(shù)據(jù)合成 尺度信息 人力成本 便捷性 預(yù)設(shè) 遮擋 標(biāo)注 | ||
本發(fā)明提供了一種訓(xùn)練數(shù)據(jù)的生成方法、對(duì)象檢測(cè)模型的訓(xùn)練方法和裝置;其中,該訓(xùn)練數(shù)據(jù)的生成方法包括:獲取包含有多種對(duì)象的圖像數(shù)據(jù);從圖像數(shù)據(jù)中摳取多種對(duì)象,得到摳取的對(duì)象的摳圖數(shù)據(jù);按照預(yù)設(shè)的合成參數(shù),將摳取的對(duì)象的摳圖數(shù)據(jù)合成至對(duì)應(yīng)的背景圖像上,得到合成圖像;其中,合成參數(shù)包括摳圖數(shù)據(jù)對(duì)應(yīng)的對(duì)象的種類、摳圖數(shù)據(jù)的尺度信息、旋轉(zhuǎn)角度、遮擋程度和背景圖像中的一種或多種;將合成圖像作為對(duì)象檢測(cè)模型的訓(xùn)練數(shù)據(jù)。本發(fā)明通過調(diào)整多種合成參數(shù),可以由少量的圖像數(shù)據(jù)合成得到大量的合成圖像,從而提高了獲取大量訓(xùn)練數(shù)據(jù)的便捷性,降低了對(duì)訓(xùn)練數(shù)據(jù)標(biāo)注處理的人力成本。
技術(shù)領(lǐng)域
本發(fā)明涉及對(duì)象檢測(cè)技術(shù)領(lǐng)域,尤其是涉及一種訓(xùn)練數(shù)據(jù)的生成方法、對(duì)象檢測(cè)模型的訓(xùn)練方法和裝置。
背景技術(shù)
對(duì)象檢測(cè)(object detection)是計(jì)算機(jī)視覺的重要領(lǐng)域。較為流行的對(duì)象檢測(cè)方法有兩種,一種是以Faster R-CNN為代表的二階段(two-stage)方法,另一種是以YOLO為代表一階段(one-stage)方法。然而,不管哪種對(duì)象檢測(cè)方法,都需要海量的并且?guī)?biāo)注的訓(xùn)練數(shù)據(jù)對(duì)模型進(jìn)行訓(xùn)練,才能得到檢測(cè)效果較高的對(duì)象檢測(cè)模型。
在實(shí)際應(yīng)用中,獲取海量的并且?guī)?biāo)注的訓(xùn)練數(shù)據(jù)并不容易。以商品檢測(cè)為例,可以直接到超市或者某些特定的商品出售場(chǎng)所(比如藥房)拍攝,但這種方式可行性不高;也可以將商品購回,在實(shí)驗(yàn)室環(huán)境下拍攝。但由于商品的類別非常多,一家藥店可能就有上萬種藥品,而這些藥品在空間上的排列又有無窮多種可能,所以想要在實(shí)驗(yàn)室環(huán)境中盡可能窮舉實(shí)際應(yīng)用場(chǎng)景中可能的排列變化,需要耗費(fèi)較多的人力和時(shí)間,方式較為繁瑣。另外,即使通過拍攝海量圖片的方式獲取到了大量的圖像,對(duì)這些圖像進(jìn)行信息標(biāo)注同樣需要大量的人力和時(shí)間,代價(jià)較高。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明的目的在于提供一種訓(xùn)練數(shù)據(jù)的生成方法、對(duì)象檢測(cè)模型的訓(xùn)練方法和裝置,以提高獲取大量訓(xùn)練數(shù)據(jù)的便捷性,并降低對(duì)訓(xùn)練數(shù)據(jù)標(biāo)注處理的人力成本。
第一方面,本發(fā)明實(shí)施例提供了一種訓(xùn)練數(shù)據(jù)的生成方法,該方法包括:獲取包含有多種對(duì)象的圖像數(shù)據(jù);其中,每種對(duì)象均標(biāo)注有對(duì)象的種類;從圖像數(shù)據(jù)中摳取多種對(duì)象,得到摳取的對(duì)象的摳圖數(shù)據(jù);按照預(yù)設(shè)的合成參數(shù),將摳取的對(duì)象的摳圖數(shù)據(jù)合成至對(duì)應(yīng)的背景圖像上,得到合成圖像;其中,合成參數(shù)包括摳圖數(shù)據(jù)對(duì)應(yīng)的對(duì)象的種類、摳圖數(shù)據(jù)的尺度信息、旋轉(zhuǎn)角度、遮擋程度和背景圖像中的一種或多種;將合成圖像作為對(duì)象檢測(cè)模型的訓(xùn)練數(shù)據(jù)。
在本發(fā)明較佳的實(shí)施例中,上述獲取包含有多種對(duì)象的圖像數(shù)據(jù)的步驟:獲取從多個(gè)角度拍攝的對(duì)象的多張圖像。
在本發(fā)明較佳的實(shí)施例中,如果合成參數(shù)中包括摳圖數(shù)據(jù)的尺度信息,將摳取的對(duì)象的摳圖數(shù)據(jù)合成至對(duì)應(yīng)的背景圖像上的步驟,包括:根據(jù)尺度信息,調(diào)整摳取的對(duì)象的摳圖數(shù)據(jù)的尺度;其中,合成至同一張背景圖像上的摳圖數(shù)據(jù)尺度相同;將尺度調(diào)整后的摳圖數(shù)據(jù)合成至對(duì)應(yīng)的背景圖像上。
在本發(fā)明較佳的實(shí)施例中,如果合成參數(shù)中包括摳圖數(shù)據(jù)的旋轉(zhuǎn)角度,將摳取的對(duì)象的摳圖數(shù)據(jù)合成至對(duì)應(yīng)的背景圖像上的步驟,包括:將每個(gè)摳取的對(duì)象的摳圖數(shù)據(jù)旋轉(zhuǎn)至對(duì)應(yīng)的旋轉(zhuǎn)角度;將旋轉(zhuǎn)后的摳圖數(shù)據(jù)合成至對(duì)應(yīng)的背景圖像上。
在本發(fā)明較佳的實(shí)施例中,上述將摳取的對(duì)象的摳圖數(shù)據(jù)合成至對(duì)應(yīng)的背景圖像上的步驟,包括:通過隨機(jī)的方式,對(duì)摳取的對(duì)象的摳圖數(shù)據(jù)進(jìn)行位置排列,將排列后的摳圖數(shù)據(jù)合成至對(duì)應(yīng)的背景圖像上。
在本發(fā)明較佳的實(shí)施例中,如果合成參數(shù)中包括摳圖數(shù)據(jù)的遮擋程度,對(duì)摳取的對(duì)象的摳圖數(shù)據(jù)進(jìn)行位置排列的步驟之后,方法還包括:根據(jù)遮擋程度,判斷摳取的對(duì)象的摳圖數(shù)據(jù)是否存在應(yīng)當(dāng)被遮擋的摳圖數(shù)據(jù);如果是,移動(dòng)被遮擋的摳圖數(shù)據(jù)至預(yù)設(shè)位置;在預(yù)設(shè)位置上,被遮擋的摳圖數(shù)據(jù)被除被遮擋的摳圖數(shù)據(jù)以外的摳圖數(shù)據(jù),按照遮擋程度遮擋。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于南京曠云科技有限公司;徐州曠視數(shù)據(jù)科技有限公司;北京曠視科技有限公司,未經(jīng)南京曠云科技有限公司;徐州曠視數(shù)據(jù)科技有限公司;北京曠視科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811382077.4/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 一種訓(xùn)練數(shù)據(jù)的模型訓(xùn)練方法及裝置
- 模型訓(xùn)練系統(tǒng)、方法和存儲(chǔ)介質(zhì)
- 一種數(shù)據(jù)訓(xùn)練方法、裝置及服務(wù)器
- 在數(shù)據(jù)隱私保護(hù)下執(zhí)行機(jī)器學(xué)習(xí)的方法和系統(tǒng)
- 獲取訓(xùn)練數(shù)據(jù)的方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 圖像識(shí)別的方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 虛擬維修訓(xùn)練平臺(tái)開發(fā)系統(tǒng)
- 分類模型的訓(xùn)練方法、數(shù)據(jù)風(fēng)險(xiǎn)類別的檢測(cè)方法及裝置
- 一種訓(xùn)練數(shù)據(jù)的糾錯(cuò)方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于音視頻的魯棒情感建模系統(tǒng)
- 圖象數(shù)據(jù)的輸出圖象調(diào)整
- 圖象數(shù)據(jù)的輸出圖象調(diào)整
- 圖象數(shù)據(jù)的輸出圖象調(diào)整
- 圖象數(shù)據(jù)的輸出圖象調(diào)整
- 創(chuàng)建基準(zhǔn)圖數(shù)據(jù)
- 過濾數(shù)據(jù)沿襲圖
- 過濾數(shù)據(jù)沿襲圖
- 圖數(shù)據(jù)質(zhì)量驗(yàn)證方法及圖數(shù)據(jù)質(zhì)量驗(yàn)證裝置
- 圖象數(shù)據(jù)處理方法、圖象數(shù)據(jù)處理裝置
- 圖象數(shù)據(jù)記錄設(shè)備及圖象數(shù)據(jù)再現(xiàn)設(shè)備





