[發(fā)明專利]一種基于多尺度注意力機制網(wǎng)絡(luò)的相位解析方法有效
| 申請?zhí)枺?/td> | 202110566297.8 | 申請日: | 2021-05-24 |
| 公開(公告)號: | CN113379818B | 公開(公告)日: | 2022-06-07 |
| 發(fā)明(設(shè)計)人: | 段智涓;朱江平;黃怡潔;游迪 | 申請(專利權(quán))人: | 四川大學(xué) |
| 主分類號: | G06T7/521 | 分類號: | G06T7/521;G06N3/04;G06N3/08 |
| 代理公司: | 四川力久律師事務(wù)所 51221 | 代理人: | 韓洋 |
| 地址: | 610065 四*** | 國省代碼: | 四川;51 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 尺度 注意力 機制 網(wǎng)絡(luò) 相位 解析 方法 | ||
1.一種基于多尺度注意力機制網(wǎng)絡(luò)的相位解析方法,其特征在于,包括以下步驟:
S1,向被測對象投影三頻N步相移條紋圖像,相機同步拍攝被所述被測對象的面形調(diào)制的變形條紋圖像;
S2,基于相移法,將所述變形條紋圖像轉(zhuǎn)換為不同頻率的截斷相位圖;
S3,從所述不同頻率的截斷相位圖中提取出最高頻率的截斷相位圖,并將所述最高頻率的截斷相位圖輸入預(yù)先訓(xùn)練好的多尺度注意力機制網(wǎng)絡(luò)中,輸出對應(yīng)的連續(xù)相位圖;
S4,將所述連續(xù)相位圖映射為三維面形深度,得到被測對象三維點云數(shù)據(jù);
所述多尺度注意力機制網(wǎng)絡(luò)包括編碼網(wǎng)絡(luò)、解碼網(wǎng)絡(luò)以及橋接網(wǎng)絡(luò),
所述編碼網(wǎng)絡(luò)與所述解碼網(wǎng)絡(luò)通過橋接網(wǎng)絡(luò)連接,并且編碼網(wǎng)絡(luò)中的各下采樣模塊與所述解碼網(wǎng)絡(luò)中相應(yīng)層級的上采樣模塊之間跳躍連接;
其中,編碼網(wǎng)絡(luò)包括5個依次連接的下采樣模塊,每個下采樣模塊將輸入特征圖的寬和高逐級縮小至輸入特征圖的1/2;
其中,解碼網(wǎng)絡(luò)包括上采樣模塊以及多尺度注意力機制模塊,上采樣模塊利用反卷積層從下而上依次恢復(fù)特征圖的寬和高,得到恢復(fù)特征圖,所述恢復(fù)特征圖與編碼網(wǎng)絡(luò)中相同尺寸的特征圖連接,得到連接特征圖,中間各層上采樣模塊分別將所述連接特征圖輸入所述多尺度注意力機制模塊,通過所述多尺度注意力機制模塊捕獲全局上下文語義信息,再輸出融合特征圖到上一層上采樣層,結(jié)合所述連接特征圖的多尺度信息進行特征融合,輸出連續(xù)相位圖;
其中,橋接網(wǎng)絡(luò)是連接編碼網(wǎng)絡(luò)和解碼網(wǎng)絡(luò)的中間模塊,主要包括依次連接的1個3*3卷積,1個殘差模塊和1個3*3卷積;
所述多尺度注意力機制網(wǎng)絡(luò)的訓(xùn)練步驟包括:
S31,向被測對象投影三頻N步相移條紋圖像,相機同步拍攝被所述被測對象面形調(diào)制的變形條紋圖像;
S32,基于N步相移法,將所述變形條紋圖像轉(zhuǎn)換為不同頻率的截斷相位圖,對不同頻率的截斷相位圖進行相位展開,得到最高頻率的連續(xù)相位圖;
S33,重復(fù)執(zhí)行步驟S31~S32,得到多組樣本數(shù)據(jù),所述樣本數(shù)據(jù)是指最高頻率的截斷相位圖及對應(yīng)的最高頻率的連續(xù)相位圖形成的圖像對;
S34,將多組最高頻率的截斷相位圖輸入多尺度注意力機制網(wǎng)絡(luò),輸出多組連續(xù)相位圖訓(xùn)練結(jié)果;
S35,將所述圖像對、所述連續(xù)相位圖訓(xùn)練結(jié)果輸入多尺度注意力機制網(wǎng)絡(luò)損失函數(shù),根據(jù)所述損失函數(shù)的結(jié)果,對所述多尺度注意力機制網(wǎng)絡(luò)進行訓(xùn)練,直到所述損失函數(shù)的結(jié)果收斂。
2.如權(quán)利要求1所述的一種基于多尺度注意力機制網(wǎng)絡(luò)的相位解析方法,其特征在于,所述編碼網(wǎng)絡(luò)中5個下采樣模塊依次輸出的特征圖寬和高分別為:1/2H*1/2W,1/4H*1/4W,1/8H*1/8W,1/16H*1/16W和1/32H*1/32W,每個下采樣模塊由依次連接的卷積層構(gòu)成,首先1個3*3的卷積層conv1用于增加特征圖的通道數(shù);其次,改進的殘差模塊用于擴大感受野的同時使網(wǎng)絡(luò)提取到的相位信息更加豐富;然后,一個3*3的卷積層conv4進一步提取可辨別的相位特征;最后,步長為2的最大池化層用于降低特征圖的分辨率,將網(wǎng)絡(luò)中的特征圖抽象化;所述改進的殘差模塊包括3*3的卷積層conv2和孔洞卷積conv3。
3.如權(quán)利要求1所述的一種基于多尺度注意力機制網(wǎng)絡(luò)的相位解析方法,其特征在于,所述解碼網(wǎng)絡(luò)主干由5個上采樣模塊搭建而成,經(jīng)每個上采樣模塊上采樣以后,輸出的特征圖分辨率依次恢復(fù)為1/16H*1/16W,1/8H*1/8W,1/4H*1/4W,1/2H*1/2W,H*W;每個上采樣模塊中特征圖首先經(jīng)過一個步長為2的反卷積層恢復(fù)特征圖的分辨率,接著經(jīng)過一個3*3的卷積層,再經(jīng)過一個殘差模塊,最后再經(jīng)過一個3*3的卷積,進一步將抽象的特征編碼為有助于被測目標(biāo)連續(xù)相位分布的信息。
4.如權(quán)利要求1所述的一種基于多尺度注意力機制網(wǎng)絡(luò)的相位解析方法,其特征在于,解碼網(wǎng)絡(luò)的第2個、第3個、第4個上采樣模塊之后分別接入多尺度注意力機制模塊,多尺度注意力機制模塊的輸出連接到下一級的上采樣模塊的輸入端。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于四川大學(xué),未經(jīng)四川大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110566297.8/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





