[發明專利]一種基于Transformer的點云幾何編解碼方法在審
| 申請號: | 202210104899.6 | 申請日: | 2022-01-28 |
| 公開(公告)號: | CN114422806A | 公開(公告)日: | 2022-04-29 |
| 發明(設計)人: | 韓成;張超;楊華民;盧時禹;李巖芳;李華;權巍;胡汗平;徐超 | 申請(專利權)人: | 長春理工大學 |
| 主分類號: | H04N19/597 | 分類號: | H04N19/597;H04N19/147;H04N19/91;G06N3/08;G06N3/04;G06K9/62 |
| 代理公司: | 安徽順超知識產權代理事務所(特殊普通合伙) 34120 | 代理人: | 賀湘君 |
| 地址: | 130000 *** | 國省代碼: | 吉林;22 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 transformer 幾何 解碼 方法 | ||
本發明公開了點云幾何編解碼技術領域的一種基于Transformer的點云幾何編解碼方法,將3379個訓練點云放在名為‘train’的文件夾內,將用來測試的621個測試點云放在名為‘test’的文件夾內;3D卷積操作對輸入張量的大小要求為[Bs,Ic,T,H,W];輸入張量中每個參數的含義:Bs表示為輸入批量大小,Ic表示為輸入張量的通道數,T表示為輸入點云三維空間網格的長;H表示為輸入點云三維空間網格的高;W表示為點云三維空間網格的寬;循環遍歷‘train’文件夾內的數據或‘test’文件夾內的數據,保存每個文件的索引地址方便后面查找使用,根據Tramsformer網絡結構實現三維點云的全局信息特征提取,提高點云解碼后精度,利用Transformer結構可以獲得三維網格空間的點云幾何信息。
技術領域
本發明涉及點云幾何編解碼技術領域,具體為一種基于Transformer的點云幾何編解碼方法。
背景技術
點云是對三維物體表面的數字化采樣,在表現形式上是由點的幾何信息(x,y,z)和屬性信息(R,G,B和紋理信息等)組成。利用三維點云信息可以重建真實的三維世界。三維點云信息主要應用在無人駕駛、高精度地圖重建、虛擬現實和增強現實等領域。相比于排列規則的2D圖像,三維點云是無規則點的集合,而且點云的數據量龐大,難以對點云的集合信息進行壓縮,基于此,本發明設計了一種基于Transformer的點云幾何編解碼方法以解決上述問題。
發明內容
本發明的目的在于提供一種基于Transformer的點云幾何編解碼方法,以解決上述背景技術中提出的,,,,,。
為實現上述目的,本發明提供如下技術方案:一種基于Transformer的點云幾何編解碼方法,包括從ModelNet數據集平臺中獲得一組測試點云傳入計算機1中,其具體步驟如下:
步驟1:將3379個訓練點云放在名為‘train’的文件夾內,將用來測試的621個測試點云放在名為‘test’的文件夾內;
步驟2:3D卷積操作對輸入張量的大小要求為[Bs,Ic,T,H,W];
步驟3:循環遍歷‘train’文件夾內的數據或‘test’文件夾內的數據,保存每個文件的索引地址方便后面查找使用;
步驟4:進入神經網絡后,經過第一次卷積操作,第一次3D卷積操作參數設置如下:Ks表示為卷積核的尺寸,St表示為卷積操作滑動步長,Ba表示為偏置量,Pa表示為對原始三維網格空間的填充,3D卷積操作所使用的卷積核為三維矩陣,矩陣中所有元素的值為隨機生成,其范圍為[-1,1]區間;在所使用的輸入張量為[1,1,64,64,64],Bs輸入批量大小為1,Ks大小為(3,3,3),St的步長為1;Pa的輸入為1,偏置量設置為True,輸出通道設置為16;經過第一次3D卷積操作之后得到的張量大小為[1,16,64,64,64];
步驟5:然后利用RELU激活函數對第一次3D卷積操作得到的張量進行第一次非線性擬合;
步驟6:將一次非線性擬合得到的張量輸入到第二次3D卷積操作,輸入的張量大小為[1,16,64,64,64],Bs輸入批量大小為1,Ks的大小為(3,3,3),St的步長為2,Pa的輸入為0,偏置量設置為True,輸出通道設置為32;經過第二次3D卷積操作之后得到的張量大小為[1,32,32,32,32];
步驟7:然后利用RELU激活函數對第二次3D卷積操作得到的張量進行第二次非線性擬合;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于長春理工大學,未經長春理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210104899.6/2.html,轉載請聲明來源鉆瓜專利網。
- 基于Transformer+LSTM神經網絡模型的商品銷量預測方法及裝置
- 一種基于Transformer模型自然場景文字識別方法
- 一種深度Transformer級聯神經網絡模型壓縮算法
- 點云分割方法、系統、介質、計算機設備、終端及應用
- 基于Transformer的中文智能對話方法
- 一種基于改進Transformer模型的飛行器故障診斷方法和系統
- 一種基于Transformer模型的機器翻譯模型優化方法
- 基于Transformer和增強交互型MPNN神經網絡的小分子表示學習方法
- 基于U-Transformer多層次特征重構的異常檢測方法及系統
- 基于EfficientDet和Transformer的航空圖像中的飛機檢測方法





