[發(fā)明專利]基于端到端深度集成學(xué)習(xí)網(wǎng)絡(luò)的三維模型分類方法有效
| 申請?zhí)枺?/td> | 201810446582.4 | 申請日: | 2018-05-11 |
| 公開(公告)號: | CN108596329B | 公開(公告)日: | 2020-08-07 |
| 發(fā)明(設(shè)計)人: | 白靜;司慶龍;劉振剛 | 申請(專利權(quán))人: | 北方民族大學(xué) |
| 主分類號: | G06N3/04 | 分類號: | G06N3/04;G06N3/08;G06K9/62 |
| 代理公司: | 廣州市華學(xué)知識產(chǎn)權(quán)代理有限公司 44245 | 代理人: | 馮炳輝 |
| 地址: | 750021 寧夏回族*** | 國省代碼: | 寧夏;64 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 端到端 深度 集成 學(xué)習(xí) 網(wǎng)絡(luò) 三維 模型 分類 方法 | ||
1.基于端到端深度集成學(xué)習(xí)網(wǎng)絡(luò)的三維模型分類方法,其特征在于:該方法是采用端到端的深度學(xué)習(xí)集成策略,輸入一個三維網(wǎng)格模型,提取多視圖表征,建立包含基學(xué)習(xí)器和集成學(xué)習(xí)器的集成深度學(xué)習(xí)網(wǎng)絡(luò),自動提取三維模型的復(fù)合特征,完成模型分類;其包括以下步驟:
S1、選用普林斯頓剛性三維模型數(shù)據(jù)集Princeton ModelNet Dataset,分別針對ModelNet10和ModelNet40,從官網(wǎng)選取所需數(shù)量的模型作為訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù),生成訓(xùn)練集和數(shù)據(jù)集;
S2、對選取的三維模型進行二維視圖渲染,構(gòu)建給定mesh網(wǎng)格的多視圖表征V={vi,1≤i≤N},其中N為視圖數(shù)目;
S3、構(gòu)建集成深度學(xué)習(xí)網(wǎng)絡(luò),選擇所需的基學(xué)習(xí)器,并構(gòu)造集成學(xué)習(xí)器;其中,所述基學(xué)習(xí)器需要完成初始決策,綜合考慮三維模型庫及其對應(yīng)二維視圖的規(guī)模及復(fù)雜性,選擇CaffeNet作為面向單個二維視圖分類的深度學(xué)習(xí)模型;所述集成學(xué)習(xí)器需要完成最終決策,綜合集成基于各個視圖的初始決策,形成對三維模型分類的最終決策,集成學(xué)習(xí)器共包含三層,第一層為集成層,后兩層為全連接層,為了避免深度學(xué)習(xí)網(wǎng)絡(luò)訓(xùn)練中出現(xiàn)過擬合,每個全連接層后有一個Dropout層;
S4、建立一個級聯(lián)損失函數(shù),有效平衡基學(xué)習(xí)器和集成學(xué)習(xí)模塊的學(xué)習(xí)能力,實現(xiàn)復(fù)雜三維模型復(fù)合信息的有效提取;
S5、擴充訓(xùn)練數(shù)據(jù),減少網(wǎng)絡(luò)的過擬合,提高預(yù)測的魯棒性;
S6、針對集成深度學(xué)習(xí)網(wǎng)絡(luò)EnsembleNet的網(wǎng)絡(luò)架構(gòu),通過基學(xué)習(xí)器預(yù)訓(xùn)、整體網(wǎng)絡(luò)初訓(xùn)、集成學(xué)習(xí)器調(diào)優(yōu)的步驟進行層次迭代式訓(xùn)練;
S7、利用步驟S6中的層次迭代式訓(xùn)練方法,得到實驗所需訓(xùn)練樣本;
S8、將訓(xùn)練樣本輸入到深度集成網(wǎng)絡(luò)EnsembleNet,得到最后的分類準(zhǔn)確率。
2.根據(jù)權(quán)利要求1所述的基于端到端深度集成學(xué)習(xí)網(wǎng)絡(luò)的三維模型分類方法,其特征在于:在步驟S1中,選用Princeton ModelNet Dataset,采用官網(wǎng)數(shù)據(jù),針對ModelNet10和ModelNet40分別選取3991、9843個模型作為訓(xùn)練數(shù)據(jù),908、2468個模型作為測試數(shù)據(jù),庫內(nèi)所有模型均按照Z軸方向正確擺放。
3.根據(jù)權(quán)利要求1所述的基于端到端深度集成學(xué)習(xí)網(wǎng)絡(luò)的三維模型分類方法,其特征在于:在步驟S3中,所述基學(xué)習(xí)器的CaffeNet共包含9層,第一層為輸入層,第二至八層為隱藏層,第九層為輸出層,各層結(jié)構(gòu)如下:
第一層,輸入層:將通過數(shù)據(jù)增廣獲得的增廣視圖作為訓(xùn)練樣本輸入到網(wǎng)絡(luò);
第二層,隱藏層:包含一個卷積層、一個激活函數(shù)層、一個池化層和一個局部相應(yīng)歸一化層;
第三層,隱藏層:包含一個卷積層、一個激活函數(shù)層、一個池化層和一個局部相應(yīng)歸一化層;
第四層,隱藏層:包含一個卷積層和一個激活函數(shù)層;
第五層,隱藏層:包含一個卷積層和一個激活函數(shù)層;
第六層,隱藏層:包含一個卷積層、一個激活函數(shù)層和一個池化層;
第七層,隱藏層:包含一個全連接層、一個激活函數(shù)層和一個DropOut層;
第八層,隱藏層:包含一個全連接層、一個激活函數(shù)層和一個DropOut層;
第九層,輸出層:包含一個全連接層和一個Softmax層。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北方民族大學(xué),未經(jīng)北方民族大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810446582.4/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





