[發明專利]基于視圖和哈希算法的三維模型檢索方法在審
| 申請號: | 202010418065.3 | 申請日: | 2020-05-18 |
| 公開(公告)號: | CN111597367A | 公開(公告)日: | 2020-08-28 |
| 發明(設計)人: | 張滿囤;燕明曉;王紅;田琪;崔時雨;齊暢;魏瑋;吳清;王小芳 | 申請(專利權)人: | 河北工業大學 |
| 主分類號: | G06F16/51 | 分類號: | G06F16/51;G06F16/583;G06N3/04;G06N3/08 |
| 代理公司: | 天津翰林知識產權代理事務所(普通合伙) 12210 | 代理人: | 付長杰 |
| 地址: | 300130 天津市紅橋區*** | 國省代碼: | 天津;12 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 視圖 算法 三維 模型 檢索 方法 | ||
1.一種基于視圖和哈希算法的三維模型檢索方法,該方法包括獲取不同三維模型不同角度拍攝的多張視圖圖片,并歸一化;
構建基于AlexNet的卷積神經網絡:在5層卷積層后經視圖層連接兩層全連接層,并在最后一個全連接層后加入哈希層,將高維特征轉為低維的哈希碼,轉化過程中設計量化損失函數來減少哈希碼的量化誤差;
利用已有三維模型數據集訓練基于AlexNet的卷積神經網絡,每個模型的特征用經過訓練好的網絡學習到的哈希特征表示;利用漢明距離計算任意給定查詢三維模型與三維模型數據庫中的三維模型的相似性,漢明距離越大表示模型越不相似,漢明距離越小表示模型越相似,按照漢明距離由小到大排序,選定排序最靠前的多個模型作為結果輸出到檢索列表。
2.根據權利要求1所述的檢索方法,其特征在于,所述視圖層為,在經5層卷積層特征提取后的同一個三維模型的多張圖片中選取每個圖片每個維度的特征最大值,生成該三維模型的特征描述子輸入到全連接層中進行處理;
所述全連接層輸出的高維特征經哈希層轉碼為低維的哈希特征fn,再將哈希特征fn按照bn=sgn(fn-0.5),轉化為離散的哈希碼bn;轉化過程中量化損失函數Lql為s.t.bn∈{0,1}k,N為輸入的樣本數,k為哈希碼的位數。
3.根據權利要求1所述的檢索方法,其特征在于,在獲取多張視圖圖片前要對不同的三維模型進行模型尺度標準化處理,通過對模型進行縮放處理將不同尺度的模型縮放到邊長為2的立方體中,具體步驟是:
1)讀取三維模型每個點的信息,找到模型最小的坐標點(xmin,ymin,zmin)和模型的最大的坐標點(xmax,ymax,zmax);
2)計算最大的坐標點與最小的坐標點的差值,取三個維度上差值的最大值作為模型包圍盒的邊長l,構建一個正方體包圍盒,將模型的中心放置在正方體的體心上;
3)將模型進行縮放,得到標準化模型:其中對于任一點的坐標(x,y,z),經過縮放后得到新的坐標(x′,y′,z′),具體的計算方法是:
x′=(x-xmin)×2/l-1
y′=(y-ymin)×2/l-1
z′=(z-zmin)×2/l-1
經過標準化處理后,模型所有點的坐標都位于[-1,1],模型處于一個邊長為2的立方體中,獲得標準化模型。
4.根據權利要求3所述的檢索方法,其特征在于,多視圖圖片的獲取過程是:將虛擬相機陣列在模型的周圍,每個模型拍攝12張視圖圖片,將多張視圖圖片歸一化處理為統一的大小后作為卷積神經網絡的輸入;具體步驟是:
1)將標準化模型放置在正二十面體的體心,在正二十面體的12個頂點處放置虛擬相機進行拍攝,獲取模型的一組256×256大小的12視圖;
2)將模型的多視圖裁剪為227×227大小,作為卷積神經網絡的輸入,剪切的方法為:
left=Cw/2-C′w/2
top=Ch/2-Ch′/2
right=left+C′w
bottom=top+C′h
其中top、bottom、left、right分別表示新尺寸(C′w,Ch′)在原尺寸(Cw,Ch)中的裁剪的上下左右邊界。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于河北工業大學,未經河北工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010418065.3/1.html,轉載請聲明來源鉆瓜專利網。





