[發明專利]一種三維模型的深度特征提取方法在審
| 申請號: | 201710148547.X | 申請日: | 2017-03-14 |
| 公開(公告)號: | CN107092859A | 公開(公告)日: | 2017-08-25 |
| 發明(設計)人: | 周燕;曾凡智 | 申請(專利權)人: | 佛山科學技術學院 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/46 |
| 代理公司: | 廣州市華學知識產權代理有限公司44245 | 代理人: | 梁瑩,顧思妍 |
| 地址: | 528011 廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 三維 模型 深度 特征 提取 方法 | ||
技術領域
本發明涉及三維模型處理技術領域,更具體地說,涉及一種三維模型的深度特征提取方法。
背景技術
隨著三維模型處理技術和計算機硬件、軟件的快速發展,以及多媒體技術和互聯網技術的推廣,大量的三維模型應用于各個領域中,人們對三維模型的應用需求也日益增大。三維模型在電子商務、建筑設計、工業設計、廣告影視和三維游戲等多個領域扮演重要的角色。大規模數據集的三維模型在社會生產生活的各個方面需要重用設計和模型檢索,因此,如何從已有的各類型的三維模型數據集中快速精確地檢索到目標三維模型,成為了亟待解決的關鍵問題。
近年來,基于深度學習的三維模型分析成為研究熱點,它結合了計算機視覺、人工智能、智能計算等研究內容,能解決三維模型的視覺任務包括三維模型特征提取、分類、識別、檢測和預測等難題。使用深度學習技術能自動地學習三維模型的隱含特征,并且能在大規模數據集上進行訓練,增強學習模型的泛化能力。
目前基于深度學習的特征提取方法,存在如下問題:如深度學習的框架提取的特征不能完全表達三維模型信息、網絡層次深帶來的計算復雜度高和網絡的過擬合問題、以及網絡學習時間長和內存儲存空間大等。隨著深度學習的技術成熟運用和對三維模型特征能力表達強的需求,使用深度學習去提取特征將為三維模型分類、檢索、檢測和識別難題帶來新的突破。
發明內容
本發明的目的在于克服現有技術中的缺點與不足,提供一種三維模型的深度特征提取方法,該方法構建深層卷積神經網絡對三維模型的極視圖進行訓練,經過迭代修正權值縮小殘差,使得網絡收斂。待訓練完畢后,提取卷積神經網絡的全鏈接層作為三維模型極視圖的深度特征,使得深度特征可用于三維模型的分類、檢索和識別等視覺任務。該方法構建深層的卷積神經網絡層次豐富,可加快網絡訓練速度和提高深度網絡擬合的準確度。
為了達到上述目的,本發明通過下述技術方案予以實現:一種三維模型的深度特征提取方法,其特征在于:
首先,提取三維模型的極視圖,作為深度卷積神經網絡的訓練輸入數據;
其次,構建深度卷積神經網絡,并對極視圖進行訓練;其中,深度卷積神經網絡包括有極視圖作為訓練輸入數據的輸入層、用于對極視圖的特征進行學習并得到二維特征圖的卷積層、用于對不同位置的二維特征圖進行聚合統計并降低特征維度的池化層、用于對二維特征圖進行排列鏈接形成一維向量的全鏈接層、以及用于輸出類別預測結果的輸出層;
再次,將極視圖輸入到深度卷積神經網絡進行訓練,直到深度卷積神經網絡收斂,實現訓練完成后深度卷積神經網絡的內部權值的確定;
最后,在已訓練好的深度卷積神經網絡中輸入需提取特征的三維模型的極視圖,計算深度卷積神經網絡中全鏈接層的特征向量,則作為需提取特征的三維模型的深度特征。
在上述方案中,本發明的三維模型的深度特征提取方法是通過深度卷積神經網絡對三維模型的極視圖進行訓練,經過迭代修正權值縮小殘差,使得網絡收斂。待訓練完畢后,提取卷積神經網絡的全鏈接層作為三維模型極視圖的深度特征。其中,極視圖對三維模型的空間集合結構全局表達,采用三維模型的極視圖可精簡和減輕深度卷積神經網絡的訓練計算量。本發明所構建的深度卷積神經網絡層次豐富,可加快網絡訓練速度和提高深度網絡擬合的準確度。其中,極視圖是指從三維模型的質心向外發射一組采樣射線,射線與模型的交點到質心的距離排列成的二維采樣圖。
具體地說,該方法包括以下步驟:
步驟s101:提取三維模型的極視圖,作為深度卷積神經網絡的訓練輸入數據,其中訓練輸入數據設置為x(i)∈χ,χ為共有N個三維模型的極視圖;第i個模型對應的類別標簽為y(i)∈{1,2,...,K},K為三維模型的類別數量;
步驟s102:構建深度卷積神經網絡;在深度卷積神經網絡中,深度卷積神經網絡包括:極視圖x(i)作為訓練輸入數據的輸入層Ι,4個卷積層C(t),t=1,2,3,4,1個池化層P,兩個全鏈接層FC(1)和FC(2),以及輸出層Ο;其中,4個卷積層C(t),t=1,2,3,4中每個卷積層和兩個全鏈接層FC(1)和FC(2)中每個全鏈接層均使用修正線性激活函數f(a)=max(0,a)替代深度卷積神經網絡中的sigmoid函數f(a)=1/(1+e-a);
步驟s103:設置深度卷積神經網絡的參數,即將深度卷積神經網絡各層權值初始化:
輸入層Ι:輸入數據為一個尺寸為(32×32)的極視圖x(i);
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于佛山科學技術學院,未經佛山科學技術學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710148547.X/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種波紋板剪切軋花生產線
- 下一篇:車銑復合加工中心





