[發(fā)明專利]基于多尺度注意力機制的真菌顯微圖像分類方法及系統(tǒng)在審
| 申請?zhí)枺?/td> | 202110509387.3 | 申請日: | 2021-05-11 |
| 公開(公告)號: | CN113205055A | 公開(公告)日: | 2021-08-03 |
| 發(fā)明(設計)人: | 許鴻雁 | 申請(專利權(quán))人: | 北京知見生命科技有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62;G06N3/04 |
| 代理公司: | 北京律誠同業(yè)知識產(chǎn)權(quán)代理有限公司 11006 | 代理人: | 祁建國 |
| 地址: | 100083 北京市海*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 尺度 注意力 機制 真菌 顯微 圖像 分類 方法 系統(tǒng) | ||
本發(fā)明提出一種基于多尺度注意力機制的真菌顯微圖像分類方法及系統(tǒng),包括:獲取訓練樣本,該訓練樣本包括多張真菌顯微圖像,且每張真菌顯微圖像具有對應的真菌類別標簽;構(gòu)建包括注意力模塊的深度學習圖像分類模型,使用該訓練樣本訓練該深度學習圖像分類模型,并將訓練完成的該深度學習圖像分類模型作為真菌圖像分類模型;將待分類的真菌顯微圖像輸入該真菌圖像分類模型,得到其真菌類別。本發(fā)明通過在網(wǎng)絡中加入注意力模塊,以使網(wǎng)絡聚焦于真菌所在的區(qū)域,盡可能忽略背景區(qū)域的影響。從而能更準確地識別形態(tài)差異較小的同屬異種真菌。
技術(shù)領(lǐng)域
本發(fā)明涉及計算機視覺中的圖像分類技術(shù)領(lǐng)域,并特別涉及一種基于多尺度注意力機制的真菌顯微圖像分類方法及系統(tǒng)。
背景技術(shù)
數(shù)據(jù)顯示,自然界真菌約200萬種,人類致病真菌約560種。真菌每年診療費約26億美金。全世界每年有數(shù)千萬醫(yī)學真菌感染者,由病原導致的真菌深部感染每年導致150萬人死亡,嚴重威脅人類健康。
如何快速準確鑒別醫(yī)學真菌感染,尤其是致命的真菌感染是世界醫(yī)學亟待攻克的難題。目前在臨床中,主要通過生化鑒定的方式來判斷致病真菌的類別,整個過程可以持續(xù)4-10天?,F(xiàn)有的基于深度學習的真菌分類識別技術(shù),大都只能對有限幾種真菌進行分類,同時存在所需要的訓練數(shù)據(jù)集非常龐大,分類準確率不高的問題。
對于真菌顯微圖像的識別分類,目前面臨的主要技術(shù)難點是:
酵母菌和有絲真菌的形態(tài)大小間存在一定的差異,酵母菌通常大小較小,在圖像中僅占一小部分區(qū)域。而有絲真菌則相對更大;
同屬異種真菌之間的形態(tài)差異較小,例如:光滑念珠菌和季也蒙念珠菌,人眼觀察時僅從圖像上很難分辨出種類。
發(fā)明內(nèi)容
對于上述,本發(fā)明在SE模塊中設計了Spatial Atrous模塊。具體而言,該模塊將三個空洞率分別為3、6、9的空洞卷積的輸出特征圖連接在一起,再輸入下個卷積層。這樣做的好處是,對于空洞率為3的空洞卷積,它輸出的特征圖尺寸較大,感受野較小,這樣的特征圖蘊含豐富的局部細節(jié)信息;對于空洞率為9的空洞卷積,它輸出的特征圖尺寸較小,感受野較大,這樣的特征圖蘊含豐富的全局細節(jié)信息。本發(fā)明將這樣三種空洞率不同的空洞卷積輸出的三種尺寸不一的特征圖融合在一起,可以獲得豐富的全局信息和局部信息,即融合了豐富的多尺度信息。這樣的網(wǎng)絡對于不同尺寸的待檢物(真菌)的魯棒性較強。并且,本發(fā)明在網(wǎng)絡中加入SE模塊,以使網(wǎng)絡聚焦于真菌所在的區(qū)域,盡可能忽略背景區(qū)域的影響。從而能更準確地識別形態(tài)差異較小的同屬異種真菌。
具體來說,本發(fā)明提出一種基于多尺度注意力機制的真菌顯微圖像分類方法,其中包括:
步驟1、獲取訓練樣本,該訓練樣本包括多張真菌顯微圖像,且每張真菌顯微圖像具有對應的真菌類別標簽;
步驟2、構(gòu)建包括注意力模塊的深度學習圖像分類模型,使用該訓練樣本訓練該深度學習圖像分類模型,并將訓練完成的該深度學習圖像分類模型作為真菌圖像分類模型;
步驟3、將待分類的真菌顯微圖像輸入該真菌圖像分類模型,得到其真菌類別。
所述的基于多尺度注意力機制的真菌顯微圖像分類方法,其中該深度學習圖像分類模型中包括串聯(lián)連接的卷積層,且串聯(lián)卷積層的輸出與該注意力模塊的輸入端相連。
所述的基于多尺度注意力機制的真菌顯微圖像分類方法,其中該深度學習圖像分類模型包括平均池化層、全連接層和激活層。
所述的基于多尺度注意力機制的真菌顯微圖像分類方法,其中輸入該深度學習圖像分類模型的真菌顯微圖像,會經(jīng)過多個卷積層提取出圖像特征,并將圖像特征輸入帶有空洞卷積的注意力模塊,使深度學習網(wǎng)絡的注意力聚焦于真菌所在區(qū)域,再經(jīng)過一層卷積層后,得到真菌類別。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京知見生命科技有限公司,未經(jīng)北京知見生命科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110509387.3/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類





