[發(fā)明專利]訓(xùn)練樣本的生成方法、目標(biāo)檢測(cè)方法和裝置在審
| 申請(qǐng)?zhí)枺?/td> | 201811141521.3 | 申請(qǐng)日: | 2018-09-28 |
| 公開(公告)號(hào): | CN109377467A | 公開(公告)日: | 2019-02-22 |
| 發(fā)明(設(shè)計(jì))人: | 錢佳景;王康;管維剛 | 申請(qǐng)(專利權(quán))人: | 阿里巴巴集團(tuán)控股有限公司 |
| 主分類號(hào): | G06T5/50 | 分類號(hào): | G06T5/50;G06T7/13;G06K9/62 |
| 代理公司: | 北京億騰知識(shí)產(chǎn)權(quán)代理事務(wù)所 11309 | 代理人: | 孫欣欣;陳霽 |
| 地址: | 英屬開曼群島大開*** | 國(guó)省代碼: | 開曼群島;KY |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 圖像 訓(xùn)練樣本 目標(biāo)檢測(cè) 神經(jīng)網(wǎng)絡(luò)模型 方法和裝置 合成 圖像目標(biāo)檢測(cè) 背景環(huán)境 背景圖像 合成處理 目標(biāo)物體 前景圖像 魯棒性 檢測(cè) | ||
本說(shuō)明書實(shí)施例提供一種訓(xùn)練樣本的生成方法、目標(biāo)檢測(cè)方法和裝置,訓(xùn)練樣本的生成方法包括:首先獲取第一圖像,第一圖像中包括至少一個(gè)干擾物體,以及獲取第二圖像,第二圖像中包括目標(biāo)檢測(cè)物體,目標(biāo)檢測(cè)物體具有四個(gè)頂點(diǎn),然后以第一圖像作為背景圖像以及以第二圖像作為前景圖像,將第一圖像和第二圖像進(jìn)行合成處理,得到合成圖像,再獲取合成圖像中四個(gè)頂點(diǎn)的位置信息,最后根據(jù)合成圖像和四個(gè)頂點(diǎn)的位置信息,生成神經(jīng)網(wǎng)絡(luò)模型的一組訓(xùn)練樣本,神經(jīng)網(wǎng)絡(luò)模型用于從圖像中檢測(cè)目標(biāo)物體的頂點(diǎn)。該方法有利于獲得大量的訓(xùn)練樣本,從而使用訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)模型針對(duì)不同的背景環(huán)境下的圖像目標(biāo)檢測(cè)的魯棒性好。
技術(shù)領(lǐng)域
本說(shuō)明書一個(gè)或多個(gè)實(shí)施例涉及圖像處理領(lǐng)域,尤其涉及訓(xùn)練樣本的生成方法、目標(biāo)檢測(cè)方法和裝置。
背景技術(shù)
當(dāng)前,常常需要在圖像中檢測(cè)具有規(guī)則幾何形狀的物體,例如,在圖像中檢測(cè)具有四邊形輪廓的物體(簡(jiǎn)稱四邊形物體),比如身份證、書籍等。現(xiàn)有的解決方案是通過(guò)傳統(tǒng)的邊緣檢測(cè)算法,比如霍夫直線檢測(cè)算法,從圖像中得到四個(gè)線段,然后兩兩計(jì)算線段所在直線相交的交點(diǎn),從而得到四邊形物體的四個(gè)頂點(diǎn)的坐標(biāo)。
在圖像的背景稍微復(fù)雜的情況下,經(jīng)過(guò)邊緣檢測(cè)算法對(duì)圖像處理后,不僅會(huì)得到四個(gè)線段,還會(huì)有不少干擾線段。現(xiàn)有的方案,通過(guò)人為設(shè)定的規(guī)則來(lái)排除這些干擾線段,比如為線段所形成的四邊形的長(zhǎng)寬比、面積的大小、相鄰線段的角度等設(shè)定相應(yīng)閾值,通過(guò)是否滿足相應(yīng)的閾值來(lái)確定四邊形物體對(duì)應(yīng)的四個(gè)線段。上述方法需要根據(jù)不同的背景環(huán)境來(lái)設(shè)置算法的閾值,因而在不同的背景環(huán)境下魯棒性較差。
因此,希望能有改進(jìn)的方案,針對(duì)不同的背景環(huán)境下的圖像目標(biāo)檢測(cè)的魯棒性好。
發(fā)明內(nèi)容
本說(shuō)明書一個(gè)或多個(gè)實(shí)施例描述了一種訓(xùn)練樣本的生成方法、目標(biāo)檢測(cè)方法和裝置,針對(duì)不同的背景環(huán)境下的圖像目標(biāo)檢測(cè)的魯棒性好。
第一方面,提供了一種訓(xùn)練樣本的生成方法,方法包括:
獲取第一圖像,所述第一圖像中包括至少一個(gè)干擾物體;
獲取第二圖像,所述第二圖像中包括目標(biāo)檢測(cè)物體,所述目標(biāo)檢測(cè)物體具有四個(gè)頂點(diǎn);
以所述第一圖像作為背景圖像以及以所述第二圖像作為前景圖像,將所述第一圖像和所述第二圖像進(jìn)行合成處理,得到合成圖像;
獲取所述合成圖像中所述四個(gè)頂點(diǎn)的位置信息;
根據(jù)所述合成圖像和所述四個(gè)頂點(diǎn)的位置信息,生成神經(jīng)網(wǎng)絡(luò)模型的一組訓(xùn)練樣本,所述神經(jīng)網(wǎng)絡(luò)模型用于從圖像中檢測(cè)目標(biāo)物體的頂點(diǎn)。
在一種可能的實(shí)施方式中,以所述第一圖像作為背景圖像以及以所述第二圖像作為前景圖像,將所述第一圖像和所述第二圖像進(jìn)行合成處理,得到合成圖像,包括:
以所述第一圖像作為背景圖像,以所述第二圖像作為前景圖像,通過(guò)改變所述第二圖像的尺寸和/或所述第二圖像的位置,將所述第一圖像和所述第二圖像進(jìn)行多次合成處理,得到多個(gè)合成圖像。
進(jìn)一步地,所述獲取所述合成圖像中所述四個(gè)頂點(diǎn)的位置信息,包括:
獲取人工輸入的所述第二圖像中所述四個(gè)頂點(diǎn)的位置信息;
根據(jù)生成合成圖像時(shí)所述第二圖像的尺寸的變化,和/或所述第二圖像的位置變化,確定所述合成圖像中所述四個(gè)頂點(diǎn)的位置信息。
進(jìn)一步地,所述獲取所述合成圖像中所述四個(gè)頂點(diǎn)的位置信息,包括:
獲取人工輸入的一個(gè)合成圖像中所述四個(gè)頂點(diǎn)的位置信息;
根據(jù)另一個(gè)合成圖像相對(duì)于該合成圖像中所述第二圖像的尺寸的變化,和/或另一個(gè)合成圖像相對(duì)于該合成圖像中所述第二圖像的位置變化,確定所述另一個(gè)合成圖像中所述四個(gè)頂點(diǎn)的位置信息。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于阿里巴巴集團(tuán)控股有限公司,未經(jīng)阿里巴巴集團(tuán)控股有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811141521.3/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 一種分類器的構(gòu)建方法
- 一種性別分類網(wǎng)絡(luò)訓(xùn)練方法、性別分類方法及相關(guān)裝置
- 人臉識(shí)別方法、裝置、存儲(chǔ)介質(zhì)及計(jì)算機(jī)設(shè)備
- 機(jī)器識(shí)別模型的訓(xùn)練及機(jī)器識(shí)別方法、裝置、電子設(shè)備
- 訓(xùn)練樣本保存方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 信息處理方法、推薦方法及相關(guān)設(shè)備
- 訓(xùn)練樣本篩選方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 文本語(yǔ)料的處理方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種圖像處理模型、機(jī)器學(xué)習(xí)模型的訓(xùn)練方法及裝置
- 預(yù)測(cè)模型訓(xùn)練、數(shù)據(jù)預(yù)測(cè)方法、裝置和存儲(chǔ)介質(zhì)
- 一種對(duì)神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練的方法、裝置及電子設(shè)備
- 一種神經(jīng)網(wǎng)絡(luò)模型壓縮方法以及裝置
- 姿態(tài)檢測(cè)方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于無(wú)標(biāo)簽數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)模型量化方法及裝置
- 神經(jīng)網(wǎng)絡(luò)模型更新方法、圖像處理方法及裝置
- 含有聚類拓?fù)漶詈系纳窠?jīng)網(wǎng)絡(luò)脈沖同步方法及系統(tǒng)
- 一種神經(jīng)網(wǎng)絡(luò)模型的部署方法、設(shè)備及介質(zhì)
- 神經(jīng)網(wǎng)絡(luò)模型的優(yōu)化方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于框架搜索的深度神經(jīng)網(wǎng)絡(luò)的加速與壓縮方法及系統(tǒng)
- 一種神經(jīng)網(wǎng)絡(luò)模型生成方法及裝置





