[發(fā)明專利]圖像識別方法、裝置、電子設備及存儲介質在審
| 申請?zhí)枺?/td> | 202010404077.0 | 申請日: | 2020-05-13 |
| 公開(公告)號: | CN111783517A | 公開(公告)日: | 2020-10-16 |
| 發(fā)明(設計)人: | 申世偉 | 申請(專利權)人: | 北京達佳互聯(lián)信息技術有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62 |
| 代理公司: | 北京潤澤恒知識產(chǎn)權代理有限公司 11319 | 代理人: | 李娜 |
| 地址: | 100085 北京市海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 圖像 識別 方法 裝置 電子設備 存儲 介質 | ||
本申請?zhí)峁┝艘环N圖像識別方法、裝置、電子設備及存儲介質,包括:從樣本圖像中,提取人體部位對應的部位區(qū)域的部位特征,樣本圖像包括部位區(qū)域具有特征物體的圖像,以及部位區(qū)域不具有特征物體的圖像;通過預設聚類算法,對所有的部位區(qū)域,按照部位特征的相似度值進行聚類,得到多個聚類簇;從聚類簇中選取目標聚類簇,目標聚類簇包括的部位區(qū)域的數(shù)量最少;將目標聚類簇包括的部位區(qū)域所對應的樣本圖像,確定為目標樣本圖像。本申請中,實現(xiàn)了對樣本圖像的中目標樣本圖像識別的完全自動化,通過目標樣本圖像訓練得到的模型能夠在檢測樣本圖像中已知特征物體類別的基礎上,進一步實現(xiàn)檢測未知特征物體類別的功能。
技術領域
本申請實施例涉及通信技術領域,尤其涉及一種圖像識別方法、裝置、電子設備及存儲介質。
背景技術
目前在模型訓練領域,通常是在已知類別的訓練樣本上訓練目標檢測模型,使得目標檢測模型能夠從視頻或圖像中,檢測到其中屬于該已知類別的特征。
相關技術中,具體在識別人體配件物體的場景下,可以通過收集已知類別的訓練樣本,并人工對訓練樣本進行標注,并利用已標注的訓練樣本,進行目標檢測模型的訓練,如,假設訓練樣本為人像照片,通過已知的帽子、背包的類別,人工進行標注,將每個樣本標注為佩戴帽子、佩戴背包、未佩戴帽子、未佩戴背包。標注完成后,可以利用訓練樣本進行目標檢測模型的訓練。訓練后的目標檢測模型可以識別視頻或圖像中,目標人物是否佩戴了帽子、背包。
但是,目前方案中,按照已知類別的訓練樣本訓練得到的目標檢測模型,并不能實現(xiàn)檢測視頻或圖像中,除該已知類別之外的其他類別的特征,使得在應用場景中需要增加新的類別時,需要進行人工對新的類別的訓練樣本進行標注以及訓練的操作,導致模型的使用效率低下。
發(fā)明內(nèi)容
本申請實施例提供一種圖像識別方法、裝置、電子設備及存儲介質,以解決相關技術中在應用場景中需要增加新的識別類別時,需要進行人工對新的類別的訓練樣本進行標注以及訓練的操作,導致模型的使用效率低下的問題。
第一方面,本申請實施例提供了一種圖像識別方法,該方法包括:
從樣本圖像中,提取人體部位對應的部位區(qū)域的部位特征,所述樣本圖像包括所述部位區(qū)域具有特征物體的圖像,以及所述部位區(qū)域不具有特征物體的圖像;
通過預設聚類算法,對所有的所述部位區(qū)域,按照所述部位特征的相似度值進行聚類,得到多個聚類簇;
從所述聚類簇中選取目標聚類簇,所述目標聚類簇包括的部位區(qū)域的數(shù)量最少;
將所述目標聚類簇包括的部位區(qū)域所對應的樣本圖像,確定為目標樣本圖像,所述目標樣本圖像的部位區(qū)域具有所述特征物體。
在一種可選實施方式中,所述通過預設聚類算法,對所有的所述部位區(qū)域,按照所述部位特征的相似度進行聚類,得到兩個聚類簇,包括:
通過層次聚類算法,對所有的所述部位區(qū)域,按照所述部位特征的相似度值進行聚類,得到兩個聚類簇。
在一種可選實施方式中,所述通過層次聚類算法,對所有的所述部位區(qū)域,按照所述部位特征的相似度值進行聚類,得到兩個聚類簇,包括:
計算各個所述部位區(qū)域的部位特征之間的相似度值;
將所述相似度值最大的兩個部位特征進行合并,得到合并的部位特征,所述合并的部位特征關聯(lián)有兩個所述部位特征分別對應的兩個部位區(qū)域;
計算剩余的部位特征、所述合并的部位特征之間的相似度值,并進入所述將所述相似度值最大的兩個部位特征進行合并,得到合并的部位特征的步驟,直至得到兩個所述聚類簇,所述聚類簇包括;所述聚類簇中部位特征所關聯(lián)的所有部位區(qū)域。
在一種可選實施方式中,從樣本圖像中,所述提取人體部位對應的部位區(qū)域的部位特征,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京達佳互聯(lián)信息技術有限公司,未經(jīng)北京達佳互聯(lián)信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010404077.0/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





