[發(fā)明專利]一種基于雙注意力機制的卷積神經(jīng)網(wǎng)絡(luò)的中藥種類識別方法在審
| 申請?zhí)枺?/td> | 202210538035.5 | 申請日: | 2022-05-18 |
| 公開(公告)號: | CN114723745A | 公開(公告)日: | 2022-07-08 |
| 發(fā)明(設(shè)計)人: | 張琪凱 | 申請(專利權(quán))人: | 南京工業(yè)大學(xué);紹興蘭紅智能科技有限公司 |
| 主分類號: | G06T7/00 | 分類號: | G06T7/00;G06T7/11;G06T5/00;G06N3/08;G06N3/04 |
| 代理公司: | 紹興市寅越專利代理事務(wù)所(普通合伙) 33285 | 代理人: | 潘敏 |
| 地址: | 210000 *** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 注意力 機制 卷積 神經(jīng)網(wǎng)絡(luò) 中藥 種類 識別 方法 | ||
本發(fā)明涉及圖像處理技術(shù)領(lǐng)域,具體涉及一種基于雙注意力機制的卷積神經(jīng)網(wǎng)絡(luò)的中藥種類識別方法;所提供的識別發(fā)方法包括:中藥樣本圖像采集、中藥樣本圖像處理、訓(xùn)練中藥的類型品級識別模型以及中藥圖像識別步驟。本發(fā)明的方法可以精確地識別中藥的種類及品級,識別的平均準確率在90%以上,彌補了目前中藥市場對于中藥無法有效鑒定的情況,并且識別的準確性較好,識別速度快,不需要漫長的等待。
技術(shù)領(lǐng)域
本發(fā)明涉及圖像處理技術(shù)領(lǐng)域,具體涉及一種基于雙注意力機制的卷積神經(jīng)網(wǎng)絡(luò)的中藥種類識別方法。
背景技術(shù)
目前,中藥種類和品級鑒定方法仍以感官審評為主,易受到評茶師經(jīng)驗、生理狀態(tài)、環(huán)境等因素影響,審評結(jié)果具有一定的主觀性。該方法不適于對中藥品質(zhì)的流水線、規(guī)模化的批量品質(zhì)檢測。
近幾年隨著人工智能領(lǐng)域的興起,深度學(xué)習技術(shù)的到了飛速發(fā)展,基于深度學(xué)習技術(shù)的圖像識別方法被廣泛應(yīng)用于各個領(lǐng)域。目前已有的中藥識別研究,大多應(yīng)用于新鮮中藥和單個中藥的識別分類上。由于中藥圖像獲取方式較為苛刻,必須使用專門的設(shè)備進行拍攝,拍攝條件也有所限制,無法應(yīng)用于中藥市場。對于中藥識別鑒定的研究相對匱乏,尚沒有一套完整的中藥種類和品級識別方法。
綜上所述,研發(fā)一種基于雙注意力機制的卷積神經(jīng)網(wǎng)絡(luò)的中藥種類識別方法,仍是圖像處理技術(shù)領(lǐng)域中急需解決的關(guān)鍵問題。
發(fā)明內(nèi)容
針對現(xiàn)有技術(shù)所存在的上述缺點,本發(fā)明通過上傳手機拍攝中藥的照片,可以實現(xiàn)中藥的識別,彌補了中藥無法有效識別鑒定的問題。
為實現(xiàn)上述目的,本發(fā)明提供了如下技術(shù)方案:
本發(fā)明提供了一種基于雙注意力機制的卷積神經(jīng)網(wǎng)絡(luò)的中藥種類識別方法,包括以下步驟:
(1)中藥樣本圖像采集:選取若干種已知中藥種類的中藥樣本,對各種類的中藥進行圖像采集,將任一樣本平鋪,通過手機拍攝獲取該樣本中藥的圖像n張;
(2)中藥樣本圖像處理:對任一樣本的n張圖像分別進行圖像分割和數(shù)據(jù)增強處理,獲取該樣本中藥的圖像庫;
(3)訓(xùn)練中藥的類型品級識別模型:對各種已知中藥種類的中藥樣本分別執(zhí)行步驟(1)-步驟(2)的操作,獲得相應(yīng)樣本的圖像庫,將各樣本中藥種類標簽與對應(yīng)的圖像庫輸入基于雙注意力機制的卷積神經(jīng)網(wǎng)絡(luò)模型進行訓(xùn)練;
(4)中藥圖像識別:將待識別中藥平鋪,通過手機拍攝獲取待識別的中藥圖像,輸入至中藥的類型品級識別模型,獲取中藥類型品級的識別結(jié)果。
本發(fā)明進一步的設(shè)置為:在步驟(1)中,手機拍攝時,將中藥區(qū)域在手機屏幕居中,占據(jù)屏幕大小的3/4。
本發(fā)明進一步的設(shè)置為:在步驟(2)中,所述圖像分割的方法為:
將原始圖像轉(zhuǎn)化為灰度圖像,然后采用高斯濾波對灰度圖像進行去噪;對去燥后的灰度圖像二值化處理以獲得中藥區(qū)域的邊界,根據(jù)邊界對原始圖像進行裁剪,獲取邊界內(nèi)的最大正方形作為裁剪的中藥圖像;以預(yù)設(shè)窗口和步長對裁剪的中藥圖像進行分割,獲得該中藥樣本分割后的若干張圖像數(shù)據(jù)。
本發(fā)明進一步的設(shè)置為:所述窗口尺寸為400*400或600*600中的任一種。
本發(fā)明進一步的設(shè)置為:所述步長為窗口邊長的1/3-2/3,將分割后的圖像部分重疊。
本發(fā)明進一步的設(shè)置為:在步驟(2)中,所述數(shù)據(jù)增強是對分割后的圖像數(shù)據(jù)進行翻轉(zhuǎn)、旋轉(zhuǎn)、縮放、加噪處理和亮度調(diào)節(jié)中的一種或多種操作。
本發(fā)明進一步的設(shè)置為:在步驟(3)中,所述卷積神經(jīng)網(wǎng)絡(luò)模型進行訓(xùn)練的方法為:
(31)通過特征提取網(wǎng)絡(luò)提取中藥圖像特征層Xk,共G組,k∈G;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于南京工業(yè)大學(xué);紹興蘭紅智能科技有限公司,未經(jīng)南京工業(yè)大學(xué);紹興蘭紅智能科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210538035.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 卷積運算處理方法及相關(guān)產(chǎn)品
- 一種卷積神經(jīng)網(wǎng)絡(luò)的計算方法及系統(tǒng)
- 卷積運算方法及系統(tǒng)
- 卷積運算方法、裝置及系統(tǒng)
- 深度神經(jīng)網(wǎng)絡(luò)裁剪方法、裝置及電子設(shè)備
- 基于卷積神經(jīng)網(wǎng)絡(luò)的圖像處理方法和圖像處理裝置
- 卷積神經(jīng)網(wǎng)絡(luò)及基于卷積神經(jīng)網(wǎng)絡(luò)的圖像處理方法
- 一種圖像處理方法、裝置以及計算機存儲介質(zhì)
- 用于卷積神經(jīng)網(wǎng)絡(luò)的卷積運算裝置
- 基于FPGA實現(xiàn)圖像識別的方法、裝置、設(shè)備及存儲介質(zhì)





