[發(fā)明專利]生成樣本圖像的方法、裝置、設(shè)備在審
| 申請?zhí)枺?/td> | 202210554527.3 | 申請日: | 2022-05-19 |
| 公開(公告)號: | CN115131602A | 公開(公告)日: | 2022-09-30 |
| 發(fā)明(設(shè)計)人: | 康戰(zhàn)輝 | 申請(專利權(quán))人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06V10/764 | 分類號: | G06V10/764;G06V10/774;G06V10/762;G06V30/414;G06V10/82;G06V20/40;G06K9/62;G06N20/00 |
| 代理公司: | 北京三高永信知識產(chǎn)權(quán)代理有限責(zé)任公司 11138 | 代理人: | 祝亞男 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 生成 樣本 圖像 方法 裝置 設(shè)備 | ||
本申請公開了一種生成樣本圖像的方法、裝置、設(shè)備,屬于圖像識別技術(shù)領(lǐng)域,可以應(yīng)用在對視頻進行物品識別的應(yīng)用場景中。所述方法包括:獲取包含長尾物品的目標圖像;對所述目標圖像進行物品識別,得到對所述目標圖像中進行物品識別的識別框;基于所述識別框的個數(shù),確定長尾物品在所述目標圖像中的顯示區(qū)域;對所述目標圖像中在所述顯示區(qū)域內(nèi)的局部圖像進行圖像處理,得到多個進行圖像處理后的目標圖像,將所述多個進行圖像處理后的目標圖像確定為對第一圖像識別模型進行訓(xùn)練的樣本圖像。本申請通過能夠增加包括長尾物品的樣本圖像的數(shù)量。
技術(shù)領(lǐng)域
本申請涉及圖像識別技術(shù)領(lǐng)域,特別涉及一種生成樣本圖像的方法、裝置、設(shè)備。
背景技術(shù)
隨著圖像識別技術(shù)的發(fā)展,基于圖像識別模型進行物品識別的應(yīng)用越來越廣泛,例如可應(yīng)用于圖像檢索、視頻檢索等技術(shù)領(lǐng)域。
圖像識別模型在應(yīng)用之前,需要通過大量的樣本圖像進行訓(xùn)練。在訓(xùn)練圖像識別模型的過程中,如果輸入到圖像識別模型中某類物品對應(yīng)的樣本圖像越多,則訓(xùn)練完成的圖像識別模型識別該類物品的準確率也就越高。
而對于網(wǎng)絡(luò)平臺中出現(xiàn)頻率較低的長尾物品,如購物平臺中需求不旺或銷量不佳的商品(如創(chuàng)意玩具、小眾工藝品等),由于網(wǎng)絡(luò)平臺中包括長尾物品的圖像較少,因此包括長尾物品且可以用作樣本圖像訓(xùn)練圖像視頻模型的圖像更少,所以圖像視頻模型識別長尾物品的準確率較低。因此如何增加長尾物品對應(yīng)的樣本圖像已成為現(xiàn)在亟需解決的技術(shù)問題。
發(fā)明內(nèi)容
本申請實施例提供了一種生成樣本圖像的方法、裝置、設(shè)備及存儲介質(zhì),能夠增加長尾物品對應(yīng)的樣本圖像。所述技術(shù)方案如下:
第一方面,提供了一種生成樣本圖像的方法,所述方法包括:
獲取包含長尾物品的目標圖像;
對所述目標圖像進行物品識別,得到對所述目標圖像中進行物品識別的識別框;
基于所述識別框的個數(shù),確定長尾物品在所述目標圖像中的顯示區(qū)域;
對所述目標圖像中在所述顯示區(qū)域內(nèi)的局部圖像進行圖像處理,得到多個進行圖像處理后的目標圖像,將所述多個進行圖像處理后的目標圖像確定為對第一圖像識別模型進行訓(xùn)練的樣本圖像。
可選的,所述獲取包含長尾物品的目標圖像,包括:
獲取包含長尾物品的樣本視頻;
在所述樣本視頻中獲取多個視頻幀,其中,所述多個視頻幀中的任意兩個視頻幀的相似度小于相似度閾值;
將所述多個視頻幀確定為目標圖像。
可選的,所述對所述目標圖像進行物品識別,得到對所述目標圖像中進行物品識別的識別框,包括:
將所述目標圖像輸入至所述第二圖像識別模型,由所述第二圖像識別模型輸出所述識別框和對應(yīng)識別結(jié)果,其中,所述第二圖像識別模型為經(jīng)過包含長尾物品的第二圖像訓(xùn)練后的圖像識別模型,所述識別結(jié)果為所述目標圖像中包括的長尾物品的物品類別以及對應(yīng)的置信度。
可選的,所述方法還包括:
如果所述第二圖像識別模型輸出的識別框為多個,則確定多個識別框中尺寸最大的目標識別框;
將所述目標識別框?qū)?yīng)的目標物品類別,確定為所述目標圖像中包括的長尾物品對應(yīng)的物品類別。
可選的,所述將所述多個進行圖像處理后的目標圖像確定為對第一圖像識別模型進行訓(xùn)練的樣本圖像,包括:
獲取所述第二圖像識別模型輸出的所述目標圖像對應(yīng)的物品類別的目標置信度,將所述目標置信度設(shè)置為由所述目標圖像得到的各樣本圖像對應(yīng)的訓(xùn)練標簽值。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于騰訊科技(深圳)有限公司,未經(jīng)騰訊科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210554527.3/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





