[發(fā)明專利]一種基于AMVNet的LIDAR語義分割方法及系統(tǒng)在審
| 申請?zhí)枺?/td> | 202110302527.X | 申請日: | 2021-03-22 |
| 公開(公告)號: | CN113033568A | 公開(公告)日: | 2021-06-25 |
| 發(fā)明(設計)人: | 潘曉光;王小華;令狐彬;焦璐璐;張娜 | 申請(專利權)人: | 山西三友和智慧信息技術股份有限公司 |
| 主分類號: | G06K9/34 | 分類號: | G06K9/34;G06K9/46;G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 太原榮信德知識產(chǎn)權代理事務所(特殊普通合伙) 14119 | 代理人: | 楊凱;連慧敏 |
| 地址: | 030006 山西省*** | 國省代碼: | 山西;14 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 amvnet lidar 語義 分割 方法 系統(tǒng) | ||
1.一種基于AMVNet的LIDAR語義分割方法,其特征在于:包括下列步驟:
S1、獲取基于SemanticKITTI視覺基準的測程數(shù)據(jù)集,對獲取的測程數(shù)據(jù)集進行預處理,預處理包括數(shù)據(jù)分割、歸一化處理、數(shù)據(jù)擴充處理和數(shù)據(jù)縮放處理;
S2、對預處理后的測程數(shù)據(jù)集進行數(shù)據(jù)劃分處理,包括訓練集和測試集,訓練集用于模型的訓練,測試集用于測試模型效果;
S3、構建基于AMVNet和LiDAR語義分割模型,并采用訓練集對LiDAR語義分割模型進行訓練;
S4、采用訓練完成LiDAR語義分割模型對待識別的測程數(shù)據(jù)集進行語義分割分析,得到對應的分析預測結果。
2.根據(jù)權利要求1所述的一種基于AMVNet的LIDAR語義分割方法,其特征在于:所述S1中的測程數(shù)據(jù)集是采用Velodyne HDL-64E傳感器采集的,所述Velodyne HDL-64E傳感器的水平角分辨率為0.08~0.35,所述Velodyne HDL-64E傳感器的垂直光束為64束。
3.根據(jù)權利要求1所述的一種基于AMVNet的LIDAR語義分割方法,其特征在于:所述S1中數(shù)據(jù)擴充處理的方法為:分別對訓練集數(shù)據(jù)進行90度、180度和270度旋轉(zhuǎn),對數(shù)據(jù)進行擴增;將擴充后的數(shù)據(jù)與原訓練集混合,構建新的數(shù)據(jù)集;用于增加訓練集數(shù)據(jù)量;所述訓練集和測試集的比例為7:3。
4.根據(jù)權利要求1所述的一種基于AMVNet的LIDAR語義分割方法,其特征在于:所述S1中歸一化處理的方法為:對每條數(shù)據(jù)進行Min-Max歸一化,其公式如下:
其中,min(x)表示像素最小值,max(x)表示像素最大值。
5.根據(jù)權利要求1所述的一種基于AMVNet的LIDAR語義分割方法,其特征在于:所述S3中LiDAR語義分割模型的訓練過程包括:
S3.1、先采用RV網(wǎng)絡模型和BEV網(wǎng)絡模型進行訓練,得到初始類預測,BEV網(wǎng)絡模型采用U-Net架構;
S3.2、對初始類預測進行訓練獲得采樣點,采樣是當多視圖網(wǎng)絡在類預測上不一致時,通過斷言引導的方法來捕獲不確定點,獲得所有點的最終預測標簽向量其中,K為類數(shù),其公式如下:
其中,s(·,·)為余弦相似度評分,τ為不確定性閾值的設計參數(shù),fi和gi分別代表RV和BEV的規(guī)范化類預測;
S3.3、從獲取的不確定點中提取相關的特征供點頭模型進行最終的標簽預測,該點頭模型將單個網(wǎng)絡的歸一化類分數(shù)與原始點數(shù)據(jù)進行連接,其公式如下:
pi=[fi gi xi]
S3.4、同時選擇了相鄰點的點級特征來作為附加的上下文,假設N(xi)是第i點的N個鄰域點的集合,則鄰域集特征定義為:
其中,點特征φ代表相鄰點k與不確定點i的相對距離,n為超參數(shù),將這些點特征和鄰域集特征傳遞給點頭模型,得到最終的分析預測結果,其公式為:
hi=pointhead(pi,Si)。
6.根據(jù)權利要求5所述的一種基于AMVNet的LIDAR語義分割方法,其特征在于:所述點頭模型包括一個MLP、一個最大池化層和一個完全連接層;Si通過MLP和maxpooled獨立處理,得到一個新的點特征,然后與pi連接,最終獲得預測結果。
7.一種基于AMVNet的LIDAR語義分割系統(tǒng),其特征在于:包括:
數(shù)據(jù)采集模塊,用于獲取基于SemanticKITTI視覺基準的測程數(shù)據(jù)集;
數(shù)據(jù)集處理模塊,用于對獲取的測程數(shù)據(jù)集進行預處理,預處理包括數(shù)據(jù)分割、歸一化處理、數(shù)據(jù)擴充處理和數(shù)據(jù)縮放處理;
數(shù)據(jù)劃分模塊,用于對預處理后的測程數(shù)據(jù)集進行數(shù)據(jù)劃分處理,包括訓練集和測試集,訓練集用于模型的訓練,測試集用于測試模型效果;
模型構建模塊,用于構建基于AMVNet和LiDAR語義分割模型,并采用訓練集對語義分割模型進行訓練;
語義分割分析模塊,用于采用訓練完成LiDAR語義分割模型對待識別的測程數(shù)據(jù)集進行語義分割分析,得到對應的分析預測結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于山西三友和智慧信息技術股份有限公司,未經(jīng)山西三友和智慧信息技術股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110302527.X/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





