[發明專利]基于全景圖及多通道CNN的三維模型分類和檢索方法有效
| 申請號: | 201810879211.5 | 申請日: | 2018-08-03 |
| 公開(公告)號: | CN109063139B | 公開(公告)日: | 2021-08-03 |
| 發明(設計)人: | 梁祺;聶為之 | 申請(專利權)人: | 天津大學 |
| 主分類號: | G06F16/583 | 分類號: | G06F16/583;G06N3/04 |
| 代理公司: | 天津市北洋有限責任專利代理事務所 12201 | 代理人: | 李林娟 |
| 地址: | 300072*** | 國省代碼: | 天津;12 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 全景 通道 cnn 三維 模型 分類 檢索 方法 | ||
1.一種基于全景圖和多通道CNN的三維模型視圖提取方法,其特征在于,所述方法包括以下步驟:
將3D模型投影到滿足預設條件的圓柱體的側面上,以3D模型的原點為中心,將3D模型的軸線平行于X、Y、Z的主軸之一來獲得初始全景圖;
在任意兩個坐標軸構成的平面中任取一角度分別以某一預設速率對三維空間中3D模型表面的角度和y坐標進行采樣,獲取初始全景圖中的每個點的兩組值,以此用來表示三維空間中3D模型表面的位置特征、以及3D模型表面的方向特征;構建多尺度網絡與多通道卷積神經網絡,將3D模型表面的位置特征、以及3D模型表面的方向特征作為輸入,進行網絡的訓練和兩種不同3D模型之間的相似性度量。
2.根據權利要求1所述的一種基于全景圖和多通道CNN的三維模型視圖提取方法,其特征在于,所述預設條件為:圓柱體的高度為底面半徑的2倍。
3.根據權利要求1所述的一種基于全景圖和多通道CNN的三維模型視圖提取方法,其特征在于,所述預設速率為:以速率2B和B對角度和y坐標進行采樣。
4.根據權利要求1所述的一種基于全景圖和多通道CNN的三維模型視圖提取方法,其特征在于,
所述多尺度網絡包括:分別提取同一輸入圖片的不同分辨率的視圖描述符,輸入圖片大小為256*256;
對于第一個尺度,大小為256*256,經過VGG16的卷積層得到特征映射,經過歸一化處理得到4096維特征映射;
對于第二個尺度,將輸入圖片的尺度變換為128*128,進行下采樣,經過卷積層得到低分辨率圖片的特征映射,經過最大池化層、以及歸一化處理得到3072維特征映射;
對于第三個尺度,將輸入的圖片的尺度變換為64*64,進行下采樣,經過卷積層得到低分辨率圖片的特征映射,經過最大池化層、以及歸一化處理得到3072維特征映射;
將三個尺度的輸出經過線性融合得到4096維特征圖,然后經過全連接層得到視圖描述符,再經過dropout,softmax層得到分類的結果向量;
最后,softmax層輸出給定輸入3D模型的類別概率,具有最高概率的類被認為是3D模型的預測類,使用動量設置為0.9的隨機梯度下降法進行訓練。
5.根據權利要求1所述的一種基于全景圖和多通道CNN的三維模型視圖提取方法,其特征在于,所述多通道卷積神經網絡包括6個通道,
用于創建一個根據全景視圖的3軸進行分割的分支通道,對于分類任務,通過取所有三個單獨概率向量的均值計算概率向量;
每個3D模型有6個描述符,其中三個為XYZ軸上的空間分布描述符,用來描述3D模型表面的位置特征;
另外三個為XYZ軸上的法向量分布描述符,即3D模型表面的方向特征;
對這6個描述符使用L1距離度量,將每個3D模型描述符與剩余的3D模型描述符進行比較。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于天津大學,未經天津大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810879211.5/1.html,轉載請聲明來源鉆瓜專利網。





