[發(fā)明專利]一種基于改進(jìn)Transformer模型的植物葉片病變識別方法在審
| 申請?zhí)枺?/td> | 202310077806.X | 申請日: | 2023-02-08 |
| 公開(公告)號: | CN116311186A | 公開(公告)日: | 2023-06-23 |
| 發(fā)明(設(shè)計)人: | 周厚奎;葉淵博;王陳燕 | 申請(專利權(quán))人: | 浙江農(nóng)林大學(xué) |
| 主分類號: | G06V20/60 | 分類號: | G06V20/60;G06V10/82;G06V10/80;G06V10/77;G06V10/774;G06N3/0464;G06N3/045;G06N3/09;G06N3/0985;G06N3/082 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 311300 浙江省*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 改進(jìn) transformer 模型 植物 葉片 病變 識別 方法 | ||
本發(fā)明公開了一種植物葉片病變的自動識別方法,所述的方法為:通過攝像頭獲取植物葉片的病變源圖像,對圖片進(jìn)行數(shù)據(jù)增強(qiáng);圖像進(jìn)行切塊后使用像素提取的方式對特征圖進(jìn)行縮放;通過十字交叉窗口增強(qiáng)窗口內(nèi)的像素信息交流并且通過并行計算的方式減少計算量;利用雙邊注意力機(jī)制計算對窗口內(nèi)進(jìn)行像素聚類,進(jìn)一步加強(qiáng)圖像內(nèi)空間信息的交流;采用自監(jiān)督學(xué)習(xí)加強(qiáng)塊之間隨機(jī)位置的信息交流;利用多尺度融合策略將每個層輸出的特征拼接與融合,強(qiáng)化全局空間位置信息的聯(lián)系。本發(fā)明提出一種基于雙邊注意力機(jī)制與多尺度特征融合的植物病變的自動識別方法,可確保對植物病變?nèi)~片自動識別并檢測出病變類型,并可根據(jù)用戶自身設(shè)定滿足不同場合下的應(yīng)用要求。
技術(shù)領(lǐng)域
本發(fā)明設(shè)計一種智能植物病變?nèi)~片識別檢測系統(tǒng),特別設(shè)計一種針對復(fù)雜背景的植物葉片病變識別檢測技術(shù)。
背景技術(shù)
經(jīng)濟(jì)和社會的不斷發(fā)展帶來了全球性的氣候和環(huán)境問題。其中糧食減產(chǎn)是全世界面臨最尖銳的問題。它導(dǎo)致全球數(shù)億人陷入糧食危機(jī)之中,過著食不果腹的日子。其中病蟲害是導(dǎo)致糧食減產(chǎn)的主要原因之一。植物在不同階段會面臨不同的蟲病害問題,這需要工作人員具有豐富的葉片病變識別能力,然而這樣的識別方法不僅效率低而且識別準(zhǔn)確率也不高。一旦不能對病株做出及時的識別,容易導(dǎo)致病株枯萎。病蟲害主要表現(xiàn)在植物的葉片病變上,因此對植物葉片病變的識別的研究具有十分重要的意義。
病蟲害導(dǎo)致植物在生長過程中出現(xiàn)葉片斑點,莖稈枯萎,果實缺陷等問題。這些蟲病變的形態(tài)學(xué)信息通常需要人工視覺檢測獲得,這是耗時且被動的。對于專家來說,人工檢測病蟲害的方法完全依賴于他們的經(jīng)驗和技能,這種方法不僅速度慢,而且效率低、成本高、主觀性強(qiáng)、準(zhǔn)確性低、及時性差。針對于植物在生長過程中感染蟲病害導(dǎo)致減產(chǎn)、過度農(nóng)藥導(dǎo)致環(huán)境污染的問題,精準(zhǔn)有效的識別方法能夠有效的解決上述問題。然而,由于以下原因,這仍然是一項具有挑戰(zhàn)性的任務(wù)。首先,不同病變種類的發(fā)病表現(xiàn)特征相似性高,同一病變又具有不同的發(fā)病程度,這容易造成識別不準(zhǔn)確的結(jié)果。其次,植物葉片病變部位相對于復(fù)雜的背景信息更難以提取。
隨著深度學(xué)習(xí)的快速發(fā)展,目前提出了很多基于卷積神經(jīng)網(wǎng)絡(luò)(CNN)的分類方法,準(zhǔn)確的分類植物圖像中的病變種類。通過采用高效的圖像識別技術(shù)可以提高圖像識別效率,降低成本,提高識別精度,克服了傳統(tǒng)方法人工特征提取的主觀性和局限性。深度學(xué)習(xí)技術(shù)的出現(xiàn)為圖像識別提供了強(qiáng)有力的技術(shù)支持。最著名的分類網(wǎng)絡(luò)之一是EfficientNet,它是通過平衡分辨率、深度和寬度這三個維度,來實現(xiàn)網(wǎng)絡(luò)在效率和準(zhǔn)確率上的優(yōu)化。此外,已經(jīng)提出了許多變體,通過引入注意力機(jī)制和自監(jiān)督方式來改進(jìn)現(xiàn)有的CNN網(wǎng)絡(luò),以進(jìn)一步提高分類性能。
基于CNN的病蟲害檢測方法可以自動提取原始圖像中的特征,克服了傳統(tǒng)方法人工特征提取的主觀性和局限性,解決了人工設(shè)計的特征提取器,無法得到最接近對象自然屬性的特征表達(dá)的問題。雖然基于CNN的識別固然快速有效,但是CNN網(wǎng)絡(luò)也有其對應(yīng)的缺陷,比如平移不變形,池化導(dǎo)致信息丟失。當(dāng)圖像的同一對象發(fā)生輕微朝向或位置變化時,可能不會激活那些識別該對象的神經(jīng)元。池化的弊端在于當(dāng)圖像進(jìn)行池化使特征層維度發(fā)生變化時,會導(dǎo)致特征圖損失大量有價值的信息,不可避免地會丟失分辨率和難以細(xì)化,以及忽略了局部與整體之間的關(guān)聯(lián)性。
如何在有限數(shù)據(jù)的條件下和數(shù)據(jù)背景環(huán)境復(fù)雜的植物葉片病害識別研究一直是研究的難點和熱點的問題。理想的植物病害識別系統(tǒng)應(yīng)該是基于足量的數(shù)據(jù)作為支撐,然而在實驗過程中所獲得的數(shù)據(jù)往往不能達(dá)到深度學(xué)習(xí)的要求,從而導(dǎo)致網(wǎng)絡(luò)模型在數(shù)量少的數(shù)據(jù)集上產(chǎn)生過擬合以及收斂奔潰的現(xiàn)象,弱化模型泛化能力。在現(xiàn)實中進(jìn)行數(shù)據(jù)收集過程中,所獲得的數(shù)據(jù)集通常是由人工拍的,這樣的獲取結(jié)果會造成圖像在不同時間段有不同的特征表現(xiàn),同時由于自然環(huán)境以及復(fù)雜的背景信息會導(dǎo)致所獲得的圖像主體不能被網(wǎng)絡(luò)模型有效識別出來,影響樣本的識別結(jié)果準(zhǔn)確性。目前針對模型訓(xùn)練出現(xiàn)過擬合的手段多為數(shù)據(jù)擴(kuò)增,數(shù)據(jù)擴(kuò)增的確能夠有效的解決模型過擬合的現(xiàn)象,但是盲目且冗余的擴(kuò)增手段同時會帶模型泛化能力削弱的現(xiàn)象。因此如何在數(shù)據(jù)量小的數(shù)據(jù)集上更能關(guān)注到圖像關(guān)鍵信息,構(gòu)建可靠、穩(wěn)定、高精度的植物葉片病害識別系統(tǒng)具有重要意義。
發(fā)明內(nèi)容
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于浙江農(nóng)林大學(xué),未經(jīng)浙江農(nóng)林大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310077806.X/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 基于Transformer+LSTM神經(jīng)網(wǎng)絡(luò)模型的商品銷量預(yù)測方法及裝置
- 一種基于Transformer模型自然場景文字識別方法
- 一種深度Transformer級聯(lián)神經(jīng)網(wǎng)絡(luò)模型壓縮算法
- 點云分割方法、系統(tǒng)、介質(zhì)、計算機(jī)設(shè)備、終端及應(yīng)用
- 基于Transformer的中文智能對話方法
- 一種基于改進(jìn)Transformer模型的飛行器故障診斷方法和系統(tǒng)
- 一種基于Transformer模型的機(jī)器翻譯模型優(yōu)化方法
- 基于Transformer和增強(qiáng)交互型MPNN神經(jīng)網(wǎng)絡(luò)的小分子表示學(xué)習(xí)方法
- 基于U-Transformer多層次特征重構(gòu)的異常檢測方法及系統(tǒng)
- 基于EfficientDet和Transformer的航空圖像中的飛機(jī)檢測方法





