[發(fā)明專利]生成樣本圖像的方法、裝置、設(shè)備在審

申請?zhí)枺?/td>	202210554527.3	申請日：	2022-05-19
公開（公告）號：	CN115131602A	公開（公告）日：	2022-09-30
發(fā)明（設(shè)計）人：	康戰(zhàn)輝	申請（專利權(quán)）人：	騰訊科技（深圳）有限公司
主分類號：	G06V10/764	分類號：	G06V10/764;G06V10/774;G06V10/762;G06V30/414;G06V10/82;G06V20/40;G06K9/62;G06N20/00
代理公司：	北京三高永信知識產(chǎn)權(quán)代理有限責(zé)任公司 11138	代理人：	祝亞男
地址：	518057 廣東省深圳***	國省代碼：	廣東;44
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	生成樣本圖像方法裝置設(shè)備
鉆瓜網(wǎng) 技術(shù)展會專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【說明書】：

本申請公開了一種生成樣本圖像的方法、裝置、設(shè)備，屬于圖像識別技術(shù)領(lǐng)域，可以應(yīng)用在對視頻進行物品識別的應(yīng)用場景中。所述方法包括：獲取包含長尾物品的目標圖像；對所述目標圖像進行物品識別，得到對所述目標圖像中進行物品識別的識別框；基于所述識別框的個數(shù)，確定長尾物品在所述目標圖像中的顯示區(qū)域；對所述目標圖像中在所述顯示區(qū)域內(nèi)的局部圖像進行圖像處理，得到多個進行圖像處理后的目標圖像，將所述多個進行圖像處理后的目標圖像確定為對第一圖像識別模型進行訓(xùn)練的樣本圖像。本申請通過能夠增加包括長尾物品的樣本圖像的數(shù)量。

技術(shù)領(lǐng)域

本申請涉及圖像識別技術(shù)領(lǐng)域，特別涉及一種生成樣本圖像的方法、裝置、設(shè)備。

背景技術(shù)

隨著圖像識別技術(shù)的發(fā)展，基于圖像識別模型進行物品識別的應(yīng)用越來越廣泛，例如可應(yīng)用于圖像檢索、視頻檢索等技術(shù)領(lǐng)域。

圖像識別模型在應(yīng)用之前，需要通過大量的樣本圖像進行訓(xùn)練。在訓(xùn)練圖像識別模型的過程中，如果輸入到圖像識別模型中某類物品對應(yīng)的樣本圖像越多，則訓(xùn)練完成的圖像識別模型識別該類物品的準確率也就越高。

而對于網(wǎng)絡(luò)平臺中出現(xiàn)頻率較低的長尾物品，如購物平臺中需求不旺或銷量不佳的商品(如創(chuàng)意玩具、小眾工藝品等)，由于網(wǎng)絡(luò)平臺中包括長尾物品的圖像較少，因此包括長尾物品且可以用作樣本圖像訓(xùn)練圖像視頻模型的圖像更少，所以圖像視頻模型識別長尾物品的準確率較低。因此如何增加長尾物品對應(yīng)的樣本圖像已成為現(xiàn)在亟需解決的技術(shù)問題。

發(fā)明內(nèi)容

本申請實施例提供了一種生成樣本圖像的方法、裝置、設(shè)備及存儲介質(zhì)，能夠增加長尾物品對應(yīng)的樣本圖像。所述技術(shù)方案如下：

第一方面，提供了一種生成樣本圖像的方法，所述方法包括：

獲取包含長尾物品的目標圖像；

對所述目標圖像進行物品識別，得到對所述目標圖像中進行物品識別的識別框；

基于所述識別框的個數(shù)，確定長尾物品在所述目標圖像中的顯示區(qū)域；

對所述目標圖像中在所述顯示區(qū)域內(nèi)的局部圖像進行圖像處理，得到多個進行圖像處理后的目標圖像，將所述多個進行圖像處理后的目標圖像確定為對第一圖像識別模型進行訓(xùn)練的樣本圖像。

可選的，所述獲取包含長尾物品的目標圖像，包括：

獲取包含長尾物品的樣本視頻；

在所述樣本視頻中獲取多個視頻幀，其中，所述多個視頻幀中的任意兩個視頻幀的相似度小于相似度閾值；

將所述多個視頻幀確定為目標圖像。

可選的，所述對所述目標圖像進行物品識別，得到對所述目標圖像中進行物品識別的識別框，包括：

將所述目標圖像輸入至所述第二圖像識別模型，由所述第二圖像識別模型輸出所述識別框和對應(yīng)識別結(jié)果，其中，所述第二圖像識別模型為經(jīng)過包含長尾物品的第二圖像訓(xùn)練后的圖像識別模型，所述識別結(jié)果為所述目標圖像中包括的長尾物品的物品類別以及對應(yīng)的置信度。

可選的，所述方法還包括：

如果所述第二圖像識別模型輸出的識別框為多個，則確定多個識別框中尺寸最大的目標識別框；

將所述目標識別框?qū)?yīng)的目標物品類別，確定為所述目標圖像中包括的長尾物品對應(yīng)的物品類別。

可選的，所述將所述多個進行圖像處理后的目標圖像確定為對第一圖像識別模型進行訓(xùn)練的樣本圖像，包括：

獲取所述第二圖像識別模型輸出的所述目標圖像對應(yīng)的物品類別的目標置信度，將所述目標置信度設(shè)置為由所述目標圖像得到的各樣本圖像對應(yīng)的訓(xùn)練標簽值。

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于騰訊科技（深圳）有限公司，未經(jīng)騰訊科技（深圳）有限公司許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202210554527.3/2.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

同類專利

專利分類

G 物理

G06 計算；推算；計數(shù)

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實用新型專利、外觀設(shè)計專利（升級中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】