[發(fā)明專利]基于ViT框架的多類目巖礦快速分類方法、設(shè)備及存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 202111409265.3 | 申請日: | 2021-11-25 |
| 公開(公告)號: | CN114219988A | 公開(公告)日: | 2022-03-22 |
| 發(fā)明(設(shè)計)人: | 林偉華;劉福江;黎卓武;郭艷;李鵬;周季;唐家玉;孫煜文 | 申請(專利權(quán))人: | 中國地質(zhì)大學(xué)(武漢);武漢圖歌信息技術(shù)有限責(zé)任公司 |
| 主分類號: | G06V20/00 | 分類號: | G06V20/00;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 武漢紅觀專利代理事務(wù)所(普通合伙) 42247 | 代理人: | 曾國輝 |
| 地址: | 430000 湖*** | 國省代碼: | 湖北;42 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 vit 框架 類目 快速 分類 方法 設(shè)備 存儲 介質(zhì) | ||
本發(fā)明提出了一種基于ViT框架的多類目巖礦快速分類方法、設(shè)備及存儲介質(zhì),通過構(gòu)建自然巖礦圖像識別模型,其中自然巖礦圖像識別模型的預(yù)處理模塊對巖礦圖像數(shù)據(jù)進行特征預(yù)提取和抑制過擬合處理,并輸入至數(shù)據(jù)處理模塊中進行參數(shù)訓(xùn)練和Token提取,再輸入至結(jié)果處理模塊根據(jù)所述參數(shù)訓(xùn)練和Token提取結(jié)果進行Token分離和類別映射并輸出分類結(jié)果。本發(fā)明在構(gòu)建自然巖礦圖像識別模型時,在采用遷移卷積聯(lián)合ViT框架的基礎(chǔ)上,加入了STFE模塊、ECTG模塊、Mlti?Head P?Attention模塊以及RCLinaer層,從而減緩過擬合,提升映射的容錯率,更加精確完整地提取圖像數(shù)據(jù)的特征,實現(xiàn)了減少巖礦圖像數(shù)據(jù)中干擾因素對分類結(jié)果的影響,在大容量多類目的情況下實現(xiàn)對巖礦圖像的快速精準識別的目的。
技術(shù)領(lǐng)域
本發(fā)明涉及自然巖礦圖像識別技術(shù)領(lǐng)域,尤其涉及一種基于ViT框架的多類目巖礦快速分類方法、設(shè)備及存儲介質(zhì)。
背景技術(shù)
自然巖礦識別與分類能提高野外巖礦勘探提供更高效的輔助,對不同環(huán)境下對巖礦樣本的類別識別以及非專業(yè)人士了解巖礦知識有重要意義。
一般來講,傳統(tǒng)的自然巖礦識別需要專業(yè)人員通過實物或者多方面圖像信息進行識別與分類,這種人工識別的方式,一方面需要耗費大量時間,另一方面對鑒定人員的相關(guān)知識也有較高的要求。
近年來自然巖礦圖像領(lǐng)域的識別技術(shù)進展有卓越的成果,引入深度學(xué)習(xí)方法后進一步提高了自動化識別巖礦類別的效率,可以更具圖像特征對自然巖礦圖像進行類別判別。但自然巖礦圖像與其他圖像不同,自然巖礦來源于自然環(huán)境,存在更加復(fù)雜多變的干擾因素,比如光照亮度、拍攝角度、目標在圖像中的占比、圖像的清晰程度、樣本表面雜質(zhì)的覆蓋比例等等,相對比專業(yè)的巖礦切片圖像,存在更多的冗余與干信息,進而導(dǎo)致在多較多類別的巖礦自然圖像進行分類時結(jié)果不夠精確。
另外,對自然巖礦的識別,更加依賴數(shù)據(jù)集的支持,需要基于大量的數(shù)據(jù)進行特征學(xué)習(xí),同時要求數(shù)據(jù)的真實可靠性,以保證學(xué)習(xí)結(jié)果的可靠性。
因此,當(dāng)前還沒有一個普遍適用的方法,能夠解決無法在大容量多類目的情況下實現(xiàn)對巖礦圖像的快速精準識別的問題。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明提出了一種基于ViT框架的多類目巖礦快速分類方法,用于解決無法在大容量多類目的情況下實現(xiàn)對巖礦圖像的快速精準識別的問題。
本發(fā)明的技術(shù)方案是這樣實現(xiàn)的:
本發(fā)明第一方面,公開一種基于ViT框架的多類目巖礦快速分類方法,建立自然巖礦圖像識別模型進行多類目巖礦快速分類,所述方法包括:
S1,采集巖礦圖像數(shù)據(jù)集樣本輸入至自然巖礦圖像識別模型的預(yù)處理模塊,進行特征預(yù)提取和抑制過擬合處理,所述數(shù)據(jù)集樣本包括圖像數(shù)據(jù)以及與其對應(yīng)的類別標簽,繼續(xù)執(zhí)行步驟S2;
S2,將經(jīng)過預(yù)處理模塊的數(shù)據(jù)集樣本輸入至自然巖礦圖像識別模型的數(shù)據(jù)處理模塊中進行參數(shù)訓(xùn)練和Token提取,繼續(xù)執(zhí)行步驟S3;
S3,自然巖礦圖像識別模型的結(jié)果處理模塊根據(jù)所述參數(shù)訓(xùn)練和Token提取結(jié)果進行Token分離和類別映射并輸出分類結(jié)果,完成對所述自然巖礦圖像識別模型的訓(xùn)練;繼續(xù)執(zhí)行步驟S4;
S4,獲取待識別圖像數(shù)據(jù)并輸入至所述自然巖礦圖像識別模型,完成對所述待識別圖像數(shù)據(jù)的分類并輸出結(jié)果。
本發(fā)明通過上述方法,建立自然巖礦圖像識別模型,獲取圖像數(shù)據(jù)中的重要特征,減小識別過程中干擾因素對識別結(jié)果的影響,以獲得精準可靠的分類結(jié)果。
在以上技術(shù)方案的基礎(chǔ)上,優(yōu)選的,自然巖礦圖像識別模型中,
預(yù)處理模塊包括:順次連接的輸入層、圖像統(tǒng)一格式預(yù)處理模塊、遷移模型、ECTG模塊、Dropout層;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國地質(zhì)大學(xué)(武漢);武漢圖歌信息技術(shù)有限責(zé)任公司,未經(jīng)中國地質(zhì)大學(xué)(武漢);武漢圖歌信息技術(shù)有限責(zé)任公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111409265.3/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





