[發(fā)明專利]一種基于視覺Transformer的刨花板表面缺陷檢測(cè)方法在審
| 申請(qǐng)?zhí)枺?/td> | 202111680499.1 | 申請(qǐng)日: | 2021-12-30 |
| 公開(公告)號(hào): | CN114529507A | 公開(公告)日: | 2022-05-24 |
| 發(fā)明(設(shè)計(jì))人: | 韋光亮;蘇家儀;王筱東;韋瀟依;方明朗;莫振東 | 申請(qǐng)(專利權(quán))人: | 廣西慧云信息技術(shù)有限公司 |
| 主分類號(hào): | G06T7/00 | 分類號(hào): | G06T7/00;G06T7/11;G06V10/774;G06V10/82;G06V10/80;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 南寧東之智專利代理有限公司 45128 | 代理人: | 張麗媛 |
| 地址: | 530007 廣西壯族自*** | 國(guó)省代碼: | 廣西;45 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 視覺 transformer 刨花板 表面 缺陷 檢測(cè) 方法 | ||
本發(fā)明公開一種基于視覺Transformer的刨花板表面缺陷檢測(cè)方法,包括以下步驟:(1)數(shù)據(jù)集制作;(2)構(gòu)建一個(gè)基于視覺Transformer的語義分割網(wǎng)絡(luò);所述語義分割網(wǎng)絡(luò)由輸入模塊、編碼器、瓶頸模塊、解碼器、輸出模塊、跳躍連接構(gòu)成;(3)構(gòu)建損失函數(shù);(4)模型訓(xùn)練:將訓(xùn)練集輸入至步驟(2)中的語義分割網(wǎng)絡(luò),采用步驟(3)中的損失函數(shù)進(jìn)行監(jiān)督訓(xùn)練,訓(xùn)練過程中,將驗(yàn)證集輸入至訓(xùn)練好的中間模型進(jìn)行驗(yàn)證,獲得訓(xùn)練好的模型參數(shù);(5)模型推理。本發(fā)明解決刨花板表面缺陷尺度范圍跨度較大的問題,降低漏檢率與誤檢率,提高缺陷區(qū)域分割的精確率。
技術(shù)領(lǐng)域
本發(fā)明涉及刨花板表面缺陷檢測(cè)的技術(shù)領(lǐng)域,更具體地,涉及一種基于視覺Transformer的刨花板表面缺陷檢測(cè)方法。
背景技術(shù)
刨花板表面缺陷是評(píng)判刨花板質(zhì)量的重要指標(biāo)之一,刨花板表面缺陷存在影響外觀、降低強(qiáng)度、影響二次加工等弊端,對(duì)用戶造成安全隱患,對(duì)企業(yè)帶來經(jīng)濟(jì)損失,因此,為保障刨花板質(zhì)量,表面缺陷檢測(cè)是刨花板加工過程中必不可少的環(huán)節(jié)。
傳統(tǒng)的刨花板表面檢測(cè)方法依賴生產(chǎn)線工人肉眼觀察后根據(jù)經(jīng)驗(yàn)對(duì)刨花板質(zhì)量進(jìn)行評(píng)級(jí),但生產(chǎn)線上刨花板的運(yùn)動(dòng)速度可達(dá)1.5~2m/s,工人經(jīng)過長(zhǎng)時(shí)間的肉眼觀察,易產(chǎn)生視覺疲勞,導(dǎo)致漏檢率高、誤檢率高,影響檢測(cè)效果。
隨著機(jī)械化、自動(dòng)化的發(fā)展,基于視覺的刨花板表面缺陷檢測(cè)系統(tǒng)逐漸被應(yīng)用到生產(chǎn)線上,實(shí)現(xiàn)無人干預(yù)、無損檢測(cè)。刨花板表面缺陷類型較多、模式復(fù)雜,傳統(tǒng)的機(jī)器視覺算法需要人工設(shè)計(jì)特征,難以適應(yīng)復(fù)雜多變的缺陷數(shù)據(jù),魯棒性和泛化性較差;基于通用卷積神經(jīng)網(wǎng)絡(luò)的缺陷檢測(cè)算法,通過機(jī)器學(xué)習(xí)的方式自動(dòng)提取圖像局部特征,實(shí)現(xiàn)對(duì)缺陷區(qū)域的分割,但刨花板表面缺陷的尺度范圍跨度較大,如劃痕通常較長(zhǎng)、砂穿面積較大、大刨花面積較小等,導(dǎo)致分割效果不穩(wěn)定。
發(fā)明內(nèi)容
本發(fā)明針對(duì)現(xiàn)有技術(shù)不足,提供一種基于視覺Transformer的刨花板表面缺陷檢測(cè)方法,利用視覺Transformer的自注意力機(jī)制、U形跨層網(wǎng)絡(luò)結(jié)構(gòu)的低層細(xì)節(jié)與高層語義跨層融合特性,實(shí)現(xiàn)端到端的語義分割算法,解決刨花板表面缺陷尺度范圍跨度較大的問題,降低漏檢率與誤檢率,提高缺陷區(qū)域分割的精確率。
為解決上述技術(shù)問題,本發(fā)明所采用的技術(shù)方案是:一種基于視覺Transformer的刨花板表面缺陷檢測(cè)方法,包括以下步驟:
(1)數(shù)據(jù)集制作:收集海量刨花板表面缺陷的圖片,設(shè)定缺陷類別、初始分辨率和初始維度;將所有圖片按一定的比例劃分訓(xùn)練集、驗(yàn)證集與測(cè)試集;將訓(xùn)練集和驗(yàn)證集的圖片裁剪成若干個(gè)分塊圖片,每個(gè)分塊圖片的分辨率和維度都為初始分辨率和初始維度;對(duì)分塊圖片依據(jù)缺陷類別進(jìn)行語義分割標(biāo)注;
(2)預(yù)設(shè)的臨界維度,構(gòu)建一個(gè)基于視覺Transformer的語義分割網(wǎng)絡(luò):所述語義分割網(wǎng)絡(luò)由輸入模塊、編碼器、瓶頸模塊、解碼器、輸出模塊、跳躍連接構(gòu)成;
所述輸入模塊,用于將輸入圖片進(jìn)行[-0.5,0.5]歸一化,并按4x4網(wǎng)格的方式進(jìn)行圖片分塊獲得輸入處理圖片;所述輸入處理圖片的維度為目標(biāo)維度;
所述編碼器,由線性變換層組件、編碼Swin Transformer模塊組件與分塊合并組件構(gòu)成,用于逐層特征編碼;
所述線性變換層組件用于將輸入處理圖片進(jìn)行特征升維操作獲得特征數(shù)據(jù);所述編碼Swin Transformer模塊組件有若干個(gè)接收分辨率和維度都不同的編碼SwinTransformer模塊,每個(gè)編碼Swin Transformer模塊用于對(duì)接收指定維度的特征數(shù)據(jù)進(jìn)行自注意力表征學(xué)習(xí),并進(jìn)行低層細(xì)節(jié)與高層語義跨層融合;所述分塊合并組件有若干個(gè)接收維度不同的分塊合并,每個(gè)分塊合并用于將接收編碼Swin Transformer模塊組件指定維度的特征數(shù)據(jù)后將特征數(shù)據(jù)按2x2鄰域進(jìn)行連接,分辨率2倍下采樣,并進(jìn)行2倍維度的升維,得到特征數(shù)據(jù)并對(duì)比臨界維度;若特征數(shù)據(jù)未達(dá)到臨界維度則繼續(xù)輸入相應(yīng)的編碼Swin Transformer模塊,直至得到的特征數(shù)據(jù)達(dá)到臨界維度后輸入至瓶頸模塊;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣西慧云信息技術(shù)有限公司,未經(jīng)廣西慧云信息技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111680499.1/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 基于Transformer+LSTM神經(jīng)網(wǎng)絡(luò)模型的商品銷量預(yù)測(cè)方法及裝置
- 一種基于Transformer模型自然場(chǎng)景文字識(shí)別方法
- 一種深度Transformer級(jí)聯(lián)神經(jīng)網(wǎng)絡(luò)模型壓縮算法
- 點(diǎn)云分割方法、系統(tǒng)、介質(zhì)、計(jì)算機(jī)設(shè)備、終端及應(yīng)用
- 基于Transformer的中文智能對(duì)話方法
- 一種基于改進(jìn)Transformer模型的飛行器故障診斷方法和系統(tǒng)
- 一種基于Transformer模型的機(jī)器翻譯模型優(yōu)化方法
- 基于Transformer和增強(qiáng)交互型MPNN神經(jīng)網(wǎng)絡(luò)的小分子表示學(xué)習(xí)方法
- 基于U-Transformer多層次特征重構(gòu)的異常檢測(cè)方法及系統(tǒng)
- 基于EfficientDet和Transformer的航空?qǐng)D像中的飛機(jī)檢測(cè)方法





