[發明專利]一種基于自編碼的行人檢索方法在審
| 申請號: | 201611093782.3 | 申請日: | 2016-12-01 |
| 公開(公告)號: | CN106599807A | 公開(公告)日: | 2017-04-26 |
| 發明(設計)人: | 王海濱;陽平 | 申請(專利權)人: | 中科唯實科技(北京)有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62;G06F17/30 |
| 代理公司: | 北京律恒立業知識產權代理事務所(特殊普通合伙)11416 | 代理人: | 顧珊,龐立巖 |
| 地址: | 100080 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 編碼 行人 檢索 方法 | ||
技術領域
本發明涉及人工智能、機器學習、視頻檢索、統計學等技術領域,具體涉及一種深度學習自編碼快速提取特征的方法在行人檢索這一智能化監控視頻分析技術中的應用。
背景技術
在智能化監控視頻分析應用中,視頻分辨率普遍較低,通過人臉信息不足以進行身份的辨別,因此采取通過比較人的外貌如衣服、褲子的相似程度來確定不同視角下拍攝的對旬是否為相同人。這種方法來進行人識別是基于人在短時間內不會變更自身的外貌著裝的假設下進行的,跨攝像頭行人檢索正是基于行人的外貌著裝相似程度確定行人在監控視頻中出現的片段,為偵查人員提供了方面。在圖像偵查的領域,跨攝像頭行人檢索具有重大的應用價值。
深度學習(deep learning)是機器學習研究中的一個新領域,可以簡單理解為神經網絡的發展。深度學習的優勢地方就在于它可以通過學習來組合低層特征,將它們抽象成高層特征(屬性),這樣就可以發現復雜大數據的分布式特征。Hinton等人非監督貪心逐層訓練算法訓練深度信念網絡,在一定程度上解決了優化深層網絡結構的難題,隨后他們又提出多層自動編碼器這種深層結構。另外Lecun等人提出了卷積神經網絡這種網絡能夠提高BP算法的學習效率,原理就是利用網絡結構的相對空間關系來減少參數。除此之外,深度學習還衍生出其它的變形結構,例如去噪自動編碼器、DCN網絡、sum product等。
行人檢索必須備有行人特征庫,要求在監控視頻存儲的同時對視頻進行結構化處理,即抓拍得到行人目標,并且對行人目標圖像提取特征以及量化存儲以供在線檢索。行人抓拍不屬于本發明的內容,本發明內容即在抓拍后的行人目標的基礎上進行實時特征提取。目前的特征方面包括SIFT、GIST等在檢索精確上受限,而基于卷積神經的深度學習方法具有高復雜度,在實際應用中做不到對高清視頻的實時處理。本發明采用AutoEncoder模型實時對監控視頻進行結構化處理,并應用于行人檢索。
發明內容
本發明提供了一種基于自編碼的行人檢索方法,其特征在于,包括步驟:a)構建深度自編碼網絡,采用逐層貪婪的算法訓練深度自編碼網絡;b)去掉深度自編碼圖像重構部分,獲取自編碼特征提取模型;c)采用自編碼特征提取模型提取特征,利用行人的自編碼特征和標簽訓練XQDA度量模型;d)視頻實時結構化處理:視頻錄像時實時抓捕得到行人目標,采用自編碼特征提取并經XQDA變換到子空間,檢索庫保存圖像在XQDA變換后的特征向量;e)輸入檢索對象,采用自編碼特征提取并經XQDA變換,計算檢索對象特征和檢索庫中特征的距離。
優選地,所述步驟a)的訓練深度自編碼網絡包括逐層訓練和整體微調。
優選地,所述步驟a)的具體步驟為:
a1)選取行人訓練樣本X=(x1,x2,...,xn)∈Rd×n,即n個d維的訓練集。構造第一自編碼:
設編碼層的權重矩陣W1A和偏移解碼層的權重矩陣W1R和偏移以行人樣本作為輸入訓練自編碼使得輸出與輸入相同,其第一目標函數如公式所示:
其中為sigmoid函數;
a2)采用誤差反饋傳播算法優化第一目標函數,收斂后獲取隱藏層h(1)為第一層提取的特征;
a3)構造第二自動編碼器:
設編碼層的權重和偏移解碼層的權重和偏移將步驟a2得到的特征h(1)作為輸入,使得輸出與輸入盡可能相同,其第二目標函數
其中為sigmoid函數;
a4)采用誤差反饋傳播算法優化第二目標函數,優化后獲取隱藏層h(2);
a5)構造第三自編碼:設編碼層的權重和偏移解碼層的權重和偏移將步驟a4所得到的特征h(2)作為輸入,使得輸出與輸入盡可能相同,其第三目標函數
其中為sigmoid函數,并采用誤差反饋傳播算法優化第三目標函數;
a6)將步驟a1、a3和a5的三個自編碼堆疊成7層結構的深度自編碼,其中編碼端為三個自編碼的特征提取部分,解碼端為三個自編碼的重構部分,其地目標函數為:
其中為sigmoid函數;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中科唯實科技(北京)有限公司,未經中科唯實科技(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611093782.3/2.html,轉載請聲明來源鉆瓜專利網。





