[發明專利]一種數據處理方法、設備及存儲介質在審
| 申請號: | 201910319953.7 | 申請日: | 2019-04-19 |
| 公開(公告)號: | CN110046586A | 公開(公告)日: | 2019-07-23 |
| 發明(設計)人: | 徐興坤 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62 |
| 代理公司: | 廣州三環專利商標代理有限公司 44202 | 代理人: | 郝傳鑫;熊永強 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 對象特征 樣本對象 對象特征信息 存儲介質 對象標簽 數據處理 標簽 多媒體數據 對象識別 對象數據 人臉識別 異類 簇確定 準確率 聚類 合并 更新 | ||
1.一種數據處理方法,其特征在于,包括:
從多個多媒體數據中分別獲取樣本對象數據,提取所述樣本對象數據的對象特征信息;
根據所述對象特征信息對多個樣本對象數據進行聚類,得到多個具有不同簇標簽的第一對象特征簇;所有樣本對象數據的對象標簽均與所屬的第一對象特征簇的簇標簽相同;
分別清理每個第一對象特征簇中的異類對象數據,將清理后的第一對象特征簇確定為第二對象特征簇;
在多個第二對象特征簇之間進行同類簇合并,生成多個具有不同簇標簽的第三對象特征簇,將所述樣本對象數據的對象標簽更新為所屬的所述第三對象特征簇的簇標簽;
基于所述每個第三對象特征簇中的所述樣本對象數據的對象標簽和所述對象特征信息,訓練對象識別模型;所述對象識別模型用于識別待預測對象數據與目標對象數據之間的相似度。
2.根據權利要求1所述的方法,其特征在于,所述從多個多媒體數據中分別獲取樣本對象數據,提取所述樣本對象數據對應的對象特征信息,包括:
獲取多個多媒體數據中的對象位置信息,根據所述對象位置信息從每個多媒體數據中分別獲取具有目標尺寸的對象區域,將所述對象區域中的圖像內容確定為樣本對象數據,獲取所述每個樣本對象數據的對象特征信息;
若所述多媒體數據為圖像數據,則為所述圖像數據中的所述樣本對象數據隨機設置對象標簽;
若所述多媒體數據為視頻數據,則檢測所述樣本對象數據在所述視頻數據中的跟蹤軌跡信息,將具有相同所述跟蹤軌跡信息的樣本對象數據設置關聯屬性,并為具有所述關聯屬性的樣本對象數據設置相同的對象標簽。
3.根據權利要求2所述的方法,其特征在于,所述將所述對象區域中的圖像內容確定為樣本對象數據,包括:
將所述對象區域中的圖像內容進行基于目標方位的仿射變換,將仿射變換后的圖像內容確定為樣本對象數據;所述樣本對象數據中的對象處于所述目標方位;
則所述方法還包括:
獲取待預測多媒體數據;
根據所述待預測多媒體數據中的對象位置信息獲取具有目標尺寸的目標對象區域,將所述目標對象區域中的待預測圖像內容進行基于所述目標方位的仿射變換,將仿射變換后的待預測圖像內容確定為待預測對象數據;
基于對象識別模型獲取待預測對象數據與目標對象數據之間的相似度。
4.根據權利要求1所述的方法,其特征在于,所述根據所述對象特征信息對多個樣本對象數據進行聚類,得到多個具有不同簇標簽的第一對象特征簇,包括:
從多個樣本對象數據中獲取第一樣本對象數據和第二樣本對象數據,將所述第一樣本對象數據的對象標簽確定為第一對象標簽,將所述第二樣本對象數據的對象標簽確定為第二對象標簽;所述第一對象標簽和所述第二對象標簽不相同;
獲取所述第一樣本對象數據的對象特征信息和所述第二樣本對象數據的對象特征信息之間的第一圖像相似度;
若所述第一圖像相似度大于第一閾值,則將具有所述第一對象標簽的至少一個樣本對象數據和具有第二對象標簽的至少一個樣本對象數據,劃分到相同的第一對象特征簇,并將第一對象標簽和第二對象標簽設置為所劃分的第一對象特征簇的簇標簽;
當所有樣本對象數據均被劃分到所屬的第一對象特征簇時,并將每個第一對象特征簇以及所述對象特征簇中的樣本對象數據進行存儲。
5.根據權利要求1所述的方法,其特征在于,所述分別清理每個第一對象特征簇中的異類對象數據,將清理后的第一對象特征簇確定為第二對象特征簇,包括:
響應針對所述第一對象特征簇的第一標記操作,將所述第一標記操作所指示的所述第一對象特征簇中的樣本對象數據,確定為所述第一對象特征簇對應的標準對象數據;
響應針對非標準對象數據的第二標記操作,將所述第二標記操作所指示的非標準對象數據確定為異類對象數據;所述非標準對象數據為所述第一對象特征簇中除所述標準對象數據之外的樣本對象數據;
將所述異類對象數據從所述第一對象特征簇中刪除,將刪除異類對象數據的第一對象特征簇確定為第二對象特征簇。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910319953.7/1.html,轉載請聲明來源鉆瓜專利網。





