[發明專利]一種三維模型的深度特征提取方法在審
| 申請號: | 201710148547.X | 申請日: | 2017-03-14 |
| 公開(公告)號: | CN107092859A | 公開(公告)日: | 2017-08-25 |
| 發明(設計)人: | 周燕;曾凡智 | 申請(專利權)人: | 佛山科學技術學院 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/46 |
| 代理公司: | 廣州市華學知識產權代理有限公司44245 | 代理人: | 梁瑩,顧思妍 |
| 地址: | 528011 廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 三維 模型 深度 特征 提取 方法 | ||
1.一種三維模型的深度特征提取方法,其特征在于:
首先,提取三維模型的極視圖,作為深度卷積神經網絡的訓練輸入數據;
其次,構建深度卷積神經網絡,并對極視圖進行訓練;其中,深度卷積神經網絡包括有極視圖作為訓練輸入數據的輸入層、用于對極視圖的特征進行學習并得到二維特征圖的卷積層、用于對不同位置的二維特征圖進行聚合統計并降低特征維度的池化層、用于對二維特征圖進行排列鏈接形成一維向量的全鏈接層、以及用于輸出類別預測結果的輸出層;
再次,將極視圖輸入到深度卷積神經網絡進行訓練,直到深度卷積神經網絡收斂,實現訓練完成后深度卷積神經網絡的內部權值的確定;
最后,在已訓練好的深度卷積神經網絡中輸入需提取特征的三維模型的極視圖,計算深度卷積神經網絡中全鏈接層的特征向量,則作為需提取特征的三維模型的深度特征。
2.根據權利要求1所述的三維模型的深度特征提取方法,其特征在于:包括以下步驟:
步驟s101:提取三維模型的極視圖,作為深度卷積神經網絡的訓練輸入數據,其中訓練輸入數據設置為x(i)∈χ,χ為共有N個三維模型的極視圖;第i個模型對應的類別標簽為y(i)∈{1,2,...,K},K為三維模型的類別數量;
步驟s102:構建深度卷積神經網絡;在深度卷積神經網絡中,深度卷積神經網絡包括:極視圖x(i)作為訓練輸入數據的輸入層Ι,4個卷積層C(t),t=1,2,3,4,1個池化層P,兩個全鏈接層FC(1)和FC(2),以及輸出層Ο;其中,4個卷積層C(t),t=1,2,3,4中每個卷積層和兩個全鏈接層FC(1)和FC(2)中每個全鏈接層均使用修正線性激活函數f(a)=max(0,a)替代深度卷積神經網絡中的sigmoid函數f(a)=1/(1+e-a);
步驟s103:設置深度卷積神經網絡的參數,即將深度卷積神經網絡各層權值初始化:
輸入層Ι:輸入數據為一個尺寸為(32×32)的極視圖x(i);
卷積層C:4個卷積層依次對極視圖的特征進行學習,各個卷積層得到的二維特征圖的數量為Ft=(6,8,10,12),根據以下公式得到各個卷積層的二維特征圖:
其中表示C(t)的第q個二維特征圖,M表示t-1層的特征圖集合,t-1為0時,即表示二維特征圖為輸入的極視圖,表示第t-1層的第p個特征圖到第t層卷積層的第q個二維特征圖的卷積核,由[-1,1]的隨機數生成(5×5)的矩陣作為初始卷積核。bias為偏置,初始化值為0。(*)表示卷積的運算,f(·)為修正線性激活函數;通過上述公式可得到:
卷積層C(1)計算出6個尺寸為(28×28)的二維特征圖;
卷積層C(2)計算出8個尺寸為(24×24)的二維特征圖;
卷積層C(3)計算出10個尺寸為(20×20)的二維特征圖;
卷積層C(4)計算出12個尺寸為(16×16)的二維特征圖;
池化層P:通過下述公式對卷積層C(4)計算出的二維特征圖進行最大池化處理,得到12個尺寸為(8×8)的特征矩陣:
其中,PMp(u0,v0)表示二維特征圖最大池化處理的特征矩陣對應的坐標,是卷積層C(4)計算出的二維特征圖,max()是計算矩陣元素的最大值;
全鏈接層FC(1):將PMp排列成列向量(64×1),對各個矩陣的列向量全鏈接得到一維向量L0(768×1),即一維向量L0(768×1)作為全鏈接層FC(1)的輸入向量;
全鏈接層FC(2):設定全鏈接層FC(1)有512個神經元,全鏈接層FC(2)有128個神經元;并通過下述全鏈接層傳導公式計算全鏈接層FC(1)的輸出向量L1作為全鏈接層FC(2)的輸入向量,以及計算全鏈接層FC(2)的輸出向量L2作為輸出層O的輸入向量:
Ll=f(WlLl-1+bl-1)
其中Wl為FC(l-1)與FC(l)網絡權值,由[-1,1]的隨機數生成(512×768)的矩陣作為初始權值W1,生成(128×512)的矩陣作為初始權值W2;bl-1為FC(l-1)的偏置,初始值為0;f(·)為修正線性激活函數;l取1和2;
輸出層O:設置輸出層有K個神經元,計算公式如下:
y′=f(W3L2+b2);
其中,y′(i)為深度卷積神經網絡的最終輸出,i為第i個模型;W3由[-1,1]的隨機數生成(K×128)的矩陣作為初始權值;L2為全鏈接層FC(2)的輸出向量;
步驟s104:對極視圖的數據集χ進行訓練,設置學習率η為1,使用梯度隨機下降算法,根據深度卷積神經網絡輸出預測的結果y′(i)和真實的類別標簽y(i)∈{1,2,...,K}的誤差,進行反向傳播,迭代20次算法能收斂,實現訓練完成后深度卷積神經網絡的內部權值的確定;
步驟s105:在已訓練好的深度卷積神經網絡中輸入需提取特征的三維模型的極視圖x(i),并計算第2個全鏈接層FC(2)輸出的特征向量L2,即是所需提取特征的三維模型極視圖的深度特征。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于佛山科學技術學院,未經佛山科學技術學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710148547.X/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種波紋板剪切軋花生產線
- 下一篇:車銑復合加工中心





