[發明專利]一種基于深度卷積神經網絡的三維形狀分類方法在審
| 申請號: | 201710104324.3 | 申請日: | 2017-02-24 |
| 公開(公告)號: | CN106874955A | 公開(公告)日: | 2017-06-20 |
| 發明(設計)人: | 夏春秋 | 申請(專利權)人: | 深圳市唯特視科技有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/04 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 518057 廣東省深圳市高新技術產業園*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 深度 卷積 神經網絡 三維 形狀 分類 方法 | ||
技術領域
本發明涉及計算機視覺領域,尤其是涉及了一種基于深度卷積神經網絡的三維形狀分類方法。
背景技術
隨著科技技術迅速發展,已經廣泛使用卷積神經網絡實現三維形狀分類。預測給定三維形狀的對象類是計算機視覺中的一個基本問題,因為三維形狀是圖像理解的重要視覺線索。但是,目前可用的三維形狀數據集比其他常用數據集小了一個數量級,還不足以訓練模型。即使采用了很多微調方法處理小型該數據集,但需要非常長的時間。而如果采用基于深度卷積神經網絡的三維形狀分類方法,則可以通過集束搜索,得到最佳卷積神經網絡架構和參數,從而更好地預測三維形狀。同時,這種方法在自動導航、自動檢測、機器人抓取物件及裝配任務等中有許多實際的需要。
本發明提出了一種基于深度卷積神經網絡的三維形狀分類方法,它利用卷積神經網絡,首先選擇相對簡單的卷積神經網絡結構作為搜索樹的根節點,并利用集束搜索方法從根節點開始探索候選的更復雜的模型;當生成新的候選卷積神經網絡時,通過從母卷積神經網絡適當地傳送到其后代,使得集束搜索的結果有效,最終得到最佳的卷積神經網絡。本發明在流行的三維形狀數據集上的性能優于現有方法,還成功地將參數總數減少了98%左右;同時由于采用了集束搜索方法再進行知識遷移,還可以容易地應用于需要在小型訓練數據集上的魯棒性深入學習的其他問題。
發明內容
針對三維形狀數據集太小和現有分類模型處理圖像耗時的問題,本發明的目的在于提供一種基于深度卷積神經網絡的三維形狀分類方法。
為解決上述問題,本發明提供一種基于深度卷積神經網絡的三維形狀分類方法,其主要內容包括:
(一)數據輸入;
(二)初始卷積神經網絡;
(三)集束搜索;
(四)知識遷移;
其中,一種基于深度卷積神經網絡的三維形狀分類方法,每個形狀被表示為與以形狀為中心的均勻三維網格的三維像素對應的一組二進制指示符;選擇相對簡單的卷積神經網絡結構作為搜索樹的根節點,并利用集束搜索方法從根節點開始探索候選的更復雜的模型,直到不能進一步減少訓練誤差;當生成新的候選卷積神經網絡時,通過從母卷積神經網絡向后傳送合適的參數值,使得集束搜索的結果有效,最終得到最佳的卷積神經網絡。
其中,所述的數據輸入,采用三維實體集作為數據集,其包括40個各種類型的實物對象類,如椅子、桌子、廁所、沙發等;每個類有100個獨特的CAD模型,代表最常見的三維形狀,在整個數據集中總共有151128個三維像素化模型。
其中,所述的初始卷積神經網絡,選擇相對簡單的初始卷積神經網絡,初始模型僅由兩個卷積層和一個完全連接的層組成;第一卷積層具有16個大小為6和步長2的濾波器,第二卷積層具有32個大小為5和步長2的濾波器;最后,完全連接的層具有400個隱藏單元。
其中,所述的集束搜索,包括后繼函數,啟發式函數以及前瞻和回溯策略;狀態空間被定義為Ω={s},其中狀態s表示一個網絡配置;卷積神經網絡的網絡配置指定卷積和完全連接的層的數量,在每個層中使用的隱藏單元或三維卷積濾波器的數量,以及哪些層具有最大池;約束集束搜索,使得完全連接的層的大小保持與初始卷積神經網絡中相同。
進一步地,所述的后繼函數,通過從一組可能的動作A中應用動作a(a∈A),從而從s中產生新的狀態s′:Γ:s→s′;將A定義為包括兩種類型的動作:(1)在所有卷積層的頂部添加新的卷積層,其中新添加的層具有與頂部卷積層相同數量的濾波器,濾波器大小和步長和(2)使頂部卷積層中的濾波器的數量加倍。
進一步地,所述的啟發式函數,定義為訓練數據在s和s′之間的分類精度的差異;在給出s′的母狀態的情況下,排列新的狀態s′;用于引導集束搜索,集束搜索選擇前K個后續狀態,其中K取作集束寬度。
進一步地,所述的前瞻和回溯策略,首先通過從母狀態s多次應用后繼函數直到所得搜索樹達到深度限制D來探索狀態空間;然后,在樹深度D處的葉狀態s′中,用評估選擇前K個葉子s′;從這前K個葉子狀態中,回溯到母狀態的第K個子狀態,作為有效的新候選卷積神經網絡。
其中,所述的知識遷移,包括加寬網絡和加深網絡這兩種類型的搜索動作指定的知識遷移;加寬網絡估計新添加的參數,使得母卷積神經網絡及其“較寬”(頂部卷積層中的濾波器的數量較多)子卷積神經網絡以相同輸入得到相同的輸出;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳市唯特視科技有限公司,未經深圳市唯特視科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710104324.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種信息獲取的方法以及相關裝置
- 下一篇:圖像分類卷積神經網絡結構的構建方法





