[發(fā)明專利]一種識別方法及裝置在審
| 申請?zhí)枺?/td> | 201910241280.8 | 申請日: | 2019-03-28 |
| 公開(公告)號: | CN111753583A | 公開(公告)日: | 2020-10-09 |
| 發(fā)明(設(shè)計)人: | 項王盟 | 申請(專利權(quán))人: | 阿里巴巴集團(tuán)控股有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62 |
| 代理公司: | 北京三友知識產(chǎn)權(quán)代理有限公司 11127 | 代理人: | 李輝;徐煥 |
| 地址: | 英屬開曼*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 識別 方法 裝置 | ||
本申請實施例公開了一種識別方法及裝置。所述方法包括:獲取待識別行人圖像;將所述待識別行人圖像輸入至識別模型組件中,經(jīng)所述識別模型組件輸出識別結(jié)果;所述識別模型組件被設(shè)置為利用多個行人樣本圖像與所述行人樣本圖像中的行人身份之間的對應(yīng)關(guān)系訓(xùn)練得到,且在訓(xùn)練階段,將從所述行人樣本圖像提取的行人特征向量和所述識別模型組件的分類權(quán)重向量歸一化處理成兩個同心超球面。利用本申請實施例,可以實現(xiàn)對行人特征向量、分類權(quán)重向量的幅值與角度的解耦,能夠統(tǒng)一特征學(xué)習(xí)和特征匹配階段的計算方式。
技術(shù)領(lǐng)域
本申請涉及計算機(jī)視覺技術(shù)領(lǐng)域,特別涉及一種識別方法及裝置。
背景技術(shù)
行人重識別(Person ReID)是一項重要的計算機(jī)視覺任務(wù),用于從在不同攝像機(jī)下捕捉的圖像庫中識別行人,或者在單個攝像機(jī)下識別不同的時間戳。近年來,由于其在大規(guī)模監(jiān)控系統(tǒng)中的可疑人員搜索和多攝像機(jī)人員跟蹤等領(lǐng)域巨大的潛在應(yīng)用,行人重識別引起了學(xué)術(shù)界的廣泛關(guān)注。然而,由于攝像機(jī)視角、照明、攝像機(jī)分辨率和人體姿勢的巨大差異,使得行人重識別的任務(wù)極具挑戰(zhàn)性。
基于分類損失函數(shù)的卷積神經(jīng)網(wǎng)絡(luò)是相關(guān)技術(shù)中比較常用的行人重識別方式。基于神經(jīng)網(wǎng)絡(luò)的行人重識別方式主要包括特征學(xué)習(xí)和特征匹配兩個階段。在特征學(xué)習(xí)中,通常特征的方向和幅值沒有經(jīng)過解耦,因此特征鑒別性可能同時存在于特征的方向和幅值這兩個屬性中。而在特征匹配階段,通常只使用到特征的余弦距離,而余弦距離一般只考慮到特征之間的角度距離。因此,相關(guān)技術(shù)中的行人重識別方式在特征學(xué)習(xí)階段和特征匹配階段存在一定的不一致性。
因此,相關(guān)技術(shù)中亟需一種能夠消除特征學(xué)習(xí)階段和特征匹配階段之間不一致性的行人重識別方法。
發(fā)明內(nèi)容
本申請實施例的目的在于提供一種識別方法及裝置,可以實現(xiàn)對行人特征向量、分類權(quán)重向量的幅值與角度的解耦,能夠統(tǒng)一特征學(xué)習(xí)和特征匹配階段的計算方式。
本申請實施例提供的識別方法及裝置具體是這樣實現(xiàn)的:
一種識別方法,所述方法包括:
獲取待識別行人圖像;
將所述待識別行人圖像輸入至識別模型組件中,經(jīng)所述識別模型組件輸出識別結(jié)果;所述識別模型組件被設(shè)置為利用多個行人樣本圖像與所述行人樣本圖像中的行人身份之間的對應(yīng)關(guān)系訓(xùn)練得到,且在訓(xùn)練階段,將從所述行人樣本圖像提取的行人特征向量和所述識別模型組件的分類權(quán)重向量歸一化處理成兩個同心超球面。
一種識別裝置,包括處理器以及用于存儲處理器可執(zhí)行指令的存儲器,所述處理器執(zhí)行所述指令時實現(xiàn):
獲取待識別行人圖像;
將所述待識別行人圖像輸入至識別模型組件中,經(jīng)所述識別模型組件輸出識別結(jié)果;所述識別模型組件被設(shè)置為利用多個行人樣本圖像與所述行人樣本圖像中的行人身份之間的對應(yīng)關(guān)系訓(xùn)練得到,且在訓(xùn)練階段,將從所述行人樣本圖像提取的行人特征向量和所述識別模型組件的分類權(quán)重向量歸一化處理成兩個同心超球面。
一種監(jiān)測設(shè)備,包括攝像裝置和識別裝置,其中,
所述攝像裝置,用于捕捉待識別行人圖像;
所述識別裝置,用于按照所述識別方法識別所述待識別行人圖像。
一種非臨時性計算機(jī)可讀存儲介質(zhì),當(dāng)所述存儲介質(zhì)中的指令由處理器執(zhí)行時,使得處理器能夠執(zhí)行所述識別方法。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于阿里巴巴集團(tuán)控股有限公司,未經(jīng)阿里巴巴集團(tuán)控股有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910241280.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合





