[發明專利]一種基于預定義和隨機視點的多視圖三維形狀識別方法在審
| 申請號: | 202010101436.5 | 申請日: | 2020-02-19 |
| 公開(公告)號: | CN111310670A | 公開(公告)日: | 2020-06-19 |
| 發明(設計)人: | 郁錢;王躍 | 申請(專利權)人: | 江蘇理工學院 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 南京正聯知識產權代理有限公司 32243 | 代理人: | 杭行 |
| 地址: | 213011 江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 預定 隨機 視點 視圖 三維 形狀 識別 方法 | ||
1.一種基于預定義和隨機視點的多視圖三維形狀識別方法,其特征在于:所述方法中設計一種多視圖卷積神經網絡Latent-MVCNN,即LMVCNN,由三種類型的子CNN組成;第一種類型的子CNN為每個視圖圖像輸出多個類別似然,第二種類型的子CNN輸出一個隱變量以幫助第一種類型的子CNN選擇正確的類別似然,第三種類型的子CNN輸出從一個視圖的類別可能性到另一視圖的類別可能性的轉變概率;
所述方法包括如下分步驟:
步驟1,設M為預定義或隨機視點的數量,N為目標對象類別的數量,通過在這些M個視點下渲染一個3D對象,得到M個視圖圖像{xi|1≤i≤M},用表示;
步驟2,如果已被確定,則計算M個視圖圖像的整個類別可能性;
步驟3,若確定未被確定,則使用第二種類型的子CNN,選擇合適的類別似然,輸出一個隱變量Vi,其最后一層的激活函數設置為S型,由于未提供Vi的監督信號,因此Vi是隱變量,向輸出隱變量引入了具有相同維數的K個分類索引中心它們分別對應于類別似然,如果輸出隱變量Vi最接近分類索引中心cm,則意味著更有可能被分配給第m類可能性的索引;
步驟4,引入了第三種類型的子CNN以使用一對視圖圖像來預測索引變量,該子CNN是一個Siamese network,該網絡利用一對視圖圖像來輸出從一個視圖的類別可能性到另一視圖的類別可能性的轉變概率,即將從的候選值到候選值的轉變概率的發展表示為第三種類型的子CNN的輸入是一對視圖圖像,輸出是最終卷積層特征的減法,維數為K2的softmax作為最后一層連接到第三種類型的子CNN;
步驟5,對于離散的參數根據算法確定然后使用反向傳播算法通過固定來更新三種類型的子CNN和分類索引中心的參數;
步驟6,當類別似然數K和輸入視點圖像M的數量變大時,通過步驟5中的算法快速計算的值,定義一個矩陣表示當時的最佳分配概率;
步驟7,使用另一個矩陣來記住步驟6中當時,對的最佳分配H;
步驟8,所有索引變量都被賦予相同的值,一旦確定了兩個矩陣eng和pos,則步驟5中的算法獲得合適的值,在測試階段,對于輸入的視圖圖像,首先使用三種類型的CNN分別獲得類別似然性,潛在矢量和轉移概率,然后根據步驟5中的算法獲得的合適值,最后使用等式計算分類分數,根據分類分數選擇合適的分類。
2.根據權利要求1所述的一種基于預定義和隨機視點的多視圖三維形狀識別方法,其特征在于:步驟2中M個視圖圖像的整個類別可能性為:
為解決上式概率通常小于1,因此多個概率的乘積將導致非常小的值,上述等式被重寫為對數可能性之和:
3.根據權利要求1所述的一種基于預定義和隨機視點的多視圖三維形狀識別方法,其特征在于:步驟3中Vi,cm和應該服從以下方程式:
從Vi到cm的距離越小,將索引m分配給的可能性就越大,通過使用softmax,將概率定義如下:
使用負對數可能性定義了以下優化問題:
其中ylable是類別標簽。
4.根據權利要求1-3所述的一種基于預定義和隨機視點的多視圖三維形狀識別方法,其特征在于:步驟4中:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于江蘇理工學院,未經江蘇理工學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010101436.5/1.html,轉載請聲明來源鉆瓜專利網。





