[發明專利]一種用基于張量的卷積網絡提取高維特征的方法有效
| 申請號: | 201810049756.3 | 申請日: | 2018-01-18 |
| 公開(公告)號: | CN108154194B | 公開(公告)日: | 2021-04-30 |
| 發明(設計)人: | 施云惠;崔應炫;丁文鵬;尹寶才 | 申請(專利權)人: | 北京工業大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/04 |
| 代理公司: | 北京思海天達知識產權代理有限公司 11203 | 代理人: | 劉萍 |
| 地址: | 100124 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 張量 卷積 網絡 提取 特征 方法 | ||
本發明涉及一種用基于張量的卷積網絡提取高維特征的方法,可應用于多維信號的分類識別場景中。模型核心部分是分離-融合模塊,而分離-融合模塊則由可分離卷積組件和特征融合組件構成,其中,可分離卷積組件主要由多個可分離卷積層組成,特征融合組件主要由一個多維卷積核組成。那么,整個基于張量的N維卷積模型由多個N維分離-融合模塊、池化層和全連接層組成,最后一個最大池化層輸出的一組N階張量通過向量化的操作轉成一個向量輸入到全連接層中,最終輸出一個識別分類的概率向量。本發明所提的網絡模型不僅和現有的優秀模型在識別精度上性能相當,并且模型的參數量比它們少很多。
技術領域
本發明涉及一種用基于張量的卷積網絡提取高維特征的方法,尤其涉及一種基于維度可分離和特征融合的卷積方法,可應用于多維信號的分類識別場景中。
背景技術
深度學習作為機器學習的一個分支,近些年來發展非常迅猛,尤其是在2012年,Krizhevsky等人提出的AlexNet在大型圖像數據庫ImageNet的圖像分類競賽中以準確度超越第二名11%的巨大優勢奪得了冠軍,使得卷積神經網絡重新成為了學術界的焦點,在此之后,不斷有新的卷積神經網絡模型被提出,比如Google的GoogLeNet、牛津大學的VGG(Visual Geometry Group)、微軟亞洲研究院的ResNet等,這些網絡刷新了AlexNet在ImageNet上創造的紀錄。并且,卷積神經網絡不斷與一些傳統算法相融合,加上遷移學習方法的引入,使得卷積神經網絡的應用領域獲得了快速的擴展。從最初較為簡單的手寫字符識別應用,逐漸擴展到一些更加復雜的領域,如:行人檢測、行為識別、人體姿勢識別等。這些新的卷積神經網絡模型的層數在逐漸加深,網絡模型對輸入圖像的high level特征提取的能力也不斷提升,然而這帶來了模型參數冗余繁多的問題,這又直接導致了空間復雜度過高、實時性不好的問題,有些學者針對這方面的問題做了一些有意義的研究工作,LeCun等人在2014年NIPS會議上發表了一篇文章,該文章對卷積神經網絡的參數冗余性進行研究,提出了卷積神經網絡存在一定的線性結構的觀點,他們在訓練出網絡模型之后,又用奇異值分解、低秩逼近等方法通過將卷積核分解后重新訓練,在損失少量精度的條件下,大為減少了模型網絡的權值參數個數,從而較好地縮短了模型做預測時的實時響應時間,減少了網絡模型的空間復雜度,使得將卷積神經網絡模型應用于手機、網絡等場合成為可能。之后,有學者用張量分解的方法,包括張量的CP分解、Tucker分解,對卷積核進行分解后重新訓練,在減少網絡模型的時間和空間復雜度方面也取得了較好的效果。
然而,以上的這些網絡壓縮模型都是服從模型監督的思路,也就是先訓練出一個參數冗余的模型,在此基礎上再用降維、分解等方法去減少模型參數,實際上就是用一個輕量級的模型去逼近一個冗余的模型,讓后者來監督約束前者,需要訓練兩次,這樣的方法應用在二維圖像上是沒有什么問題的。但隨著視頻編碼、虛擬現實等技術的發展,對于三維、甚至更高維度的圖像數據的使用,逐漸流行起來,而這些方法是不能直接應用在高維度的圖像數據場景的,因為在高維圖像數據上直接訓練一個高維卷積神經網絡會遇到以下幾個問題,(1)要訓練的參數量是相當龐大;(2)計算復雜度也非常高;(3)高維樣本比較稀缺。這幾個問題都加大了訓練高維卷積神經網絡的難度。因此,需要繞過模型監督的這種思路,從而設計一種針對高維數據,參數量少、計算復雜度低、并且只需訓練一次就能得到最終模型的高維卷積網絡結構,才是解決高維圖像場景上的有效方法。
實際上,多維信號的每個維度對應的物理屬性和維度方向分布特性不盡相同,數據內部存在復雜的相關性。而張量是表示高維多維數據的有效工具,理論上,將多維信號組織成張量形式,研究張量空間的建模,才可能揭示多維信號的每個維度對應的物理屬性和維度方向分布特性及各個維度間復雜的相關性。本發明采用不同維度的分治和融合策略,提出一種基于張量的卷積神經網絡模型,通過該神經網絡模型,張量數據不同維度的非線性關系被充分挖掘出來,從而多維信號高維特征也能很好的被提取出來。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京工業大學,未經北京工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810049756.3/2.html,轉載請聲明來源鉆瓜專利網。





