[發(fā)明專利]人物圖像聚類方法和裝置有效
| 申請?zhí)枺?/td> | 201810286272.0 | 申請日: | 2018-03-30 |
| 公開(公告)號: | CN108509994B | 公開(公告)日: | 2022-04-12 |
| 發(fā)明(設(shè)計)人: | 車麗美 | 申請(專利權(quán))人: | 百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司 |
| 主分類號: | G06V10/762 | 分類號: | G06V10/762;G06V10/774;G06V10/82;G06K9/62 |
| 代理公司: | 北京英賽嘉華知識產(chǎn)權(quán)代理有限責(zé)任公司 11204 | 代理人: | 王達(dá)佐;馬曉亞 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 人物 圖像 方法 裝置 | ||
本申請實(shí)施例公開了人物圖像聚類方法和裝置。該方法的一具體實(shí)施方式包括:獲取多張人物圖像;對于每一張人物圖像,將該張人物圖像輸入到人體特征識別網(wǎng)絡(luò)得到該張人物圖像所包括的人物對象的人體特征圖;對于每一張人物圖像,基于人體特征圖生成該張人物圖像所包括的人物對象的人體特征向量;基于所得到的人體特征向量對多張人物圖像進(jìn)行聚類,得到至少一個類,其中一個類與一個人物對象一一對應(yīng);該實(shí)施方式提高了對人物圖像聚類的準(zhǔn)確度。
技術(shù)領(lǐng)域
本申請實(shí)施例涉及計算機(jī)技術(shù)領(lǐng)域,具體涉及圖像處理技術(shù)領(lǐng)域,尤其涉及用于人物圖像聚類方法和裝置。
背景技術(shù)
在日常生活中,或者在一些重大場合,人們可以通過手機(jī)、平板電腦、相機(jī)等終端來拍攝多張人物圖像。
當(dāng)人物圖像較多時,可以根據(jù)人物圖像中所包括的不同人物對象來對多張人物圖像進(jìn)行分類。從而將多張人物圖像分為對應(yīng)不同人物對象的多個類。每一個類中包括一個人物對象的多張人物圖像。
通常我們可以根據(jù)人物圖像中的面部圖像來提取不同人物對象的面部特征,并根據(jù)各個人物對象的面部特征將多張人物圖像進(jìn)行分類。
發(fā)明內(nèi)容
本申請實(shí)施例提出了一種人物圖像聚類方法和裝置。
第一方面,本申請實(shí)施例提供了一種人物圖像聚類方法,該方法包括:獲取多張人物圖像;對于每一張人物圖像,將該張人物圖像輸入到預(yù)先訓(xùn)練的人體特征識別網(wǎng)絡(luò)得到該張人物圖像所包括的人物對象的人體特征圖,人體特征識別網(wǎng)絡(luò)用于確定輸入到其中的人物圖像所包括的人物對象的人體特征圖;對于每一張人物圖像,基于人體特征圖生成該張人物圖像所包括的人物對象的人體特征向量;基于所生成的人體特征向量對多張人物圖像進(jìn)行聚類,得到至少一個類,其中一個類與一個人物對象一一對應(yīng);其中,人體特征識別網(wǎng)絡(luò)基于如下的訓(xùn)練步驟訓(xùn)練得到:獲取訓(xùn)練樣本集合,訓(xùn)練樣本集合中的各訓(xùn)練樣本包括訓(xùn)練人物圖像和用于指示訓(xùn)練人物圖像所包含的人物身份的標(biāo)注信息;將訓(xùn)練樣本輸入到預(yù)先建立的初始人體特征識別網(wǎng)絡(luò)中,對初始人體特征識別網(wǎng)絡(luò)進(jìn)行訓(xùn)練,得到訓(xùn)練后的人體特征識別網(wǎng)絡(luò)。
在一些實(shí)施例中,在對于每一張人物圖像,基于人體特征圖生成該張人物圖像所包括的人物對象的人體特征向量之前,該方法還包括:對于每一張人物圖像,將該張人物圖像輸入到預(yù)先訓(xùn)練的人臉特征識別模型得到該張人物圖像所包括的人物對象的面部特征圖,人臉特征識別模型用于確定輸入到其中的人物圖像所包括的人物對象的面部特征圖;以及對于每一張人物圖像,基于人體特征圖生成該張人物圖像所包括的人物對象的人體特征向量,包括:基于與該人物圖像對應(yīng)的面部特征圖以及與該人物圖像對應(yīng)的人體特征圖生成該人物圖像所包括的人物對象的人體特征向量。
在一些實(shí)施例中,人體特征識別網(wǎng)絡(luò)包括多個級聯(lián)的殘差網(wǎng)絡(luò)單元;將添加了身份標(biāo)識的多張訓(xùn)練人物圖像輸入到初始人體特征識別網(wǎng)絡(luò)中對初始人體特征識別網(wǎng)絡(luò)進(jìn)行訓(xùn)練,包括:通過將添加了身份標(biāo)識的多張訓(xùn)練人物圖像輸入到初始人體特征識別網(wǎng)絡(luò)中訓(xùn)練各級殘差網(wǎng)絡(luò)單元以確定各級殘差網(wǎng)絡(luò)單元的參數(shù)。
在一些實(shí)施例中,訓(xùn)練樣本集合包括多個訓(xùn)練樣本對,訓(xùn)練樣本對中包括人物身份相同的兩張訓(xùn)練人物圖像,或者,訓(xùn)練樣本對中包括人物身份不相同的兩張訓(xùn)練人物圖像;以及將訓(xùn)練樣本輸入到預(yù)先建立的初始人體特征識別網(wǎng)絡(luò)中,對初始人體特征識別網(wǎng)絡(luò)進(jìn)行訓(xùn)練,得到訓(xùn)練后的人體特征識別網(wǎng)絡(luò),包括:將各訓(xùn)練樣本對輸入到初始人體特征識別網(wǎng)絡(luò)進(jìn)行訓(xùn)練使得訓(xùn)練后的人體特征識別網(wǎng)絡(luò)的輸出具有如下特征:若訓(xùn)練樣本對中的兩張訓(xùn)練人物圖像對應(yīng)的人物身份相同,則基于訓(xùn)練后的人體特征識別網(wǎng)絡(luò)所輸出的與該訓(xùn)練樣本對中兩張訓(xùn)練人物圖像分別對應(yīng)的特征圖之間的相似度大于第一預(yù)設(shè)相似度閾值;若訓(xùn)練樣本對中的兩張訓(xùn)練人物圖像對應(yīng)的人物身份不相同,則基于由訓(xùn)練后的人體特征識別網(wǎng)絡(luò)所輸出的與該訓(xùn)練樣本對中兩張訓(xùn)練人物圖像分別對應(yīng)的特征圖之間的相似度小于第二預(yù)設(shè)相似度閾值;其中,第二預(yù)設(shè)相似度閾值小于第一相似度閾值。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司,未經(jīng)百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810286272.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





