[發(fā)明專利]一種基于自編碼的行人檢索方法在審
| 申請?zhí)枺?/td> | 201611093782.3 | 申請日: | 2016-12-01 |
| 公開(公告)號: | CN106599807A | 公開(公告)日: | 2017-04-26 |
| 發(fā)明(設計)人: | 王海濱;陽平 | 申請(專利權)人: | 中科唯實科技(北京)有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62;G06F17/30 |
| 代理公司: | 北京律恒立業(yè)知識產(chǎn)權代理事務所(特殊普通合伙)11416 | 代理人: | 顧珊,龐立巖 |
| 地址: | 100080 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 編碼 行人 檢索 方法 | ||
1.一種基于自編碼的行人檢索方法,其特征在于,包括步驟:
a)構建深度自編碼網(wǎng)絡,采用逐層貪婪的算法訓練深度自編碼網(wǎng)絡;
b)去掉深度自編碼圖像重構部分,獲取自編碼特征提取模型;
c)采用自編碼特征提取模型提取特征,利用行人的自編碼特征和標簽訓練XQDA度量模型;
d)視頻實時結構化處理:視頻錄像時實時抓拍得到行人目標,采用自編碼特征提取并經(jīng)XQDA變換到子空間,檢索庫保存圖像在XQDA變換后的特征向量;
e)輸入檢索對象,采用自編碼特征提取并經(jīng)跨視角二次判別分析XQDA變換,計算檢索對象特征和檢索庫中特征的距離。
2.根據(jù)權利要求1所述的方法,其特征在于:所述步驟a)的訓練深度自編碼網(wǎng)絡包括逐層訓練和整體微調(diào)。
3.根據(jù)權利要求2所述的方法,其特征在于:所述步驟a)的具體步驟為:
a1)選取行人訓練樣本X=(x1,x2,...,xn)∈Rd×n,即n個d維的訓練集。構造第一自編碼:
設編碼層的權重矩陣和偏移解碼層的權重矩陣和偏移以行人樣本作為輸入訓練自編碼使得輸出與輸入相同,其第一目標函數(shù)如公式所示:
其中為sigmoid函數(shù);
a2)采用誤差反饋傳播算法優(yōu)化第一目標函數(shù),收斂后獲取隱藏層h(1)為第一層提取的特征;
a3)構造第二自動編碼器:
設編碼層的權重和偏移解碼層的權重和偏移將步驟a2得到的特征h(1)作為輸入,使得輸出與輸入盡可能相同,其第二目標函數(shù)
其中為sigmoid函數(shù);
a4)采用誤差反饋傳播算法優(yōu)化第二目標函數(shù),優(yōu)化后獲取隱藏層h(2);
a5)構造第三自編碼:設編碼層的權重和偏移解碼層的權重和偏移將步驟a4所得到的特征h(2)作為輸入,使得輸出與輸入盡可能相同,其第三目標函數(shù)
其中為sigmoid函數(shù),并采用誤差反饋傳播算法優(yōu)化第三目標函數(shù);
a6)將步驟a1、a3和a5的三個自編碼堆疊成7層結構的深度自編碼,其中編碼端為三個自編碼的特征提取部分,解碼端為三個自編碼的重構部分,其地目標函數(shù)為:
其中為sigmoid函數(shù);
a7)用步驟a2、a4和a5訓練的權重矩陣和偏移初使深度自編碼的權重矩陣和偏移,并采用誤差反饋傳播算法優(yōu)化目標函數(shù),其中隱藏層h(3)為行人樣本的特征。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中科唯實科技(北京)有限公司,未經(jīng)中科唯實科技(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611093782.3/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。





