[發(fā)明專利]一種基于多分支局部注意力網(wǎng)絡(luò)的車輛分類方法在審
| 申請(qǐng)?zhí)枺?/td> | 202110881344.8 | 申請(qǐng)日: | 2021-08-02 |
| 公開(kāi)(公告)號(hào): | CN113610144A | 公開(kāi)(公告)日: | 2021-11-05 |
| 發(fā)明(設(shè)計(jì))人: | 周平;陳晨;閆如根;趙吉祥;胡昌隆;呂強(qiáng);李濤 | 申請(qǐng)(專利權(quán))人: | 合肥市正茂科技有限公司 |
| 主分類號(hào): | G06K9/62 | 分類號(hào): | G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 合肥天明專利事務(wù)所(普通合伙) 34115 | 代理人: | 婁岳 |
| 地址: | 230088 安*** | 國(guó)省代碼: | 安徽;34 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 分支 局部 注意力 網(wǎng)絡(luò) 車輛 分類 方法 | ||
本發(fā)明公開(kāi)了一種基于多分支局部注意力網(wǎng)絡(luò)的車輛分類方法,具體步驟包括獲取待分類車輛圖片并劃分為訓(xùn)練集和測(cè)試集;將車輛圖片的訓(xùn)練集輸入構(gòu)建多分支局部注意力網(wǎng)絡(luò)的車輛分類模型進(jìn)行訓(xùn)練,所述多分支局部注意力網(wǎng)絡(luò)包括基于通道的卷積注意力模塊,以及基于空間的局部注意力模塊;根據(jù)訓(xùn)練好的車輛分類模型對(duì)車輛圖片的測(cè)試集進(jìn)行分類預(yù)測(cè),得到分類結(jié)果。本發(fā)明在原始ResNet?50模型中添加多分支局部注意力結(jié)構(gòu),該結(jié)構(gòu)能夠更準(zhǔn)確地獲取特征圖中不同鄰域的信息,增強(qiáng)了關(guān)鍵特征的表達(dá)性,從而提高了車輛分類準(zhǔn)確率;同時(shí)我們的多分支注意力結(jié)構(gòu)具有便攜性,可以嵌入到其他網(wǎng)絡(luò)模型中。
技術(shù)領(lǐng)域
本發(fā)明涉及深度學(xué)習(xí)和計(jì)算機(jī)視覺(jué)技術(shù)領(lǐng)域,特別涉及一種基于多分支局部注意力網(wǎng)絡(luò)的車輛分類方法。
背景技術(shù)
近年來(lái),智能交通系統(tǒng)(ITS)發(fā)展快速,隨著計(jì)算機(jī)視覺(jué)和深度學(xué)習(xí)的發(fā)展,為智能交通系統(tǒng)更有效的應(yīng)用提供了契機(jī)。計(jì)算機(jī)視覺(jué)是利用計(jì)算機(jī)來(lái)模擬人的視覺(jué)能力,從客觀事物的圖像中提取信息,進(jìn)行處理并加以理解,最終應(yīng)用到實(shí)際生活中,例如車輛分類。
傳統(tǒng)的基于視覺(jué)的車輛分類方法通常是依賴于手工特征,如顏色直方圖(CH)、紋理描述符(TD)、GIST)或通過(guò)BoVW、IFK、SPM等編碼局部特征生成的表示,費(fèi)時(shí)費(fèi)力,泛化能力差,易受環(huán)境變化和遮擋的影響。隨著深度學(xué)習(xí)理論和實(shí)踐的迅速發(fā)展,基于深度學(xué)習(xí)的目標(biāo)檢測(cè)與分類進(jìn)入了一個(gè)新的階段。不同于傳統(tǒng)的特征提取算法,卷積神經(jīng)網(wǎng)絡(luò)具有一定的不變性的幾何變換、變形和光照,可以克服改變車輛外觀的困難,可以解決遮擋問(wèn)題,能夠自適應(yīng)的訓(xùn)練數(shù)據(jù)驅(qū)動(dòng)下構(gòu)建的特征描述,具有更大的靈活性和綜合能力。
現(xiàn)有的卷積神經(jīng)網(wǎng)絡(luò)方法依然存在不足之處在于,沒(méi)有明確區(qū)分關(guān)鍵信息和冗余信息,模型的特征識(shí)別能力仍然不強(qiáng)不足。期間多層卷積和池化,大量重要信息丟失,導(dǎo)致提取的特征不能很好地表示目標(biāo)。
發(fā)明內(nèi)容
本發(fā)明的目的克服現(xiàn)有技術(shù)存在的不足,為實(shí)現(xiàn)以上目的,采用一種基于多分支局部注意力網(wǎng)絡(luò)的車輛分類方法,以解決上述背景技術(shù)中提出的問(wèn)題。
一種基于多分支局部注意力網(wǎng)絡(luò)的車輛分類方法,具體步驟包括:
獲取待分類車輛圖片并劃分為訓(xùn)練集和測(cè)試集;
將車輛圖片的訓(xùn)練集輸入構(gòu)建多分支局部注意力網(wǎng)絡(luò)的車輛分類模型進(jìn)行訓(xùn)練,所述多分支局部注意力網(wǎng)絡(luò)包括基于通道的卷積注意力模塊,以及基于空間的局部注意力模塊;
根據(jù)訓(xùn)練好的車輛分類模型對(duì)車輛圖片的測(cè)試集進(jìn)行分類預(yù)測(cè),得到分類結(jié)果。
作為本發(fā)明的進(jìn)一步的方案:所述獲取待分類車輛圖片并劃分為訓(xùn)練集和測(cè)試集的具體步驟包括:
獲取車輛場(chǎng)景圖像,并劃分為訓(xùn)練集和測(cè)試集,訓(xùn)練集和測(cè)試集的比例為4:1;
所述訓(xùn)練集包括M張訓(xùn)練圖片為X={X1,X2,…,Xm,…,XM},所述訓(xùn)練集包括N張訓(xùn)練圖片為Y={Y1,Y2,…,Yn,…,YN},其中Xm表示第m張訓(xùn)練圖片,Yn表示第n張測(cè)試圖片;
對(duì)所述訓(xùn)練集和測(cè)試集的圖片進(jìn)行標(biāo)簽與原圖一對(duì)一標(biāo)注。
作為本發(fā)明的進(jìn)一步的方案:所述將車輛圖片的訓(xùn)練集輸入構(gòu)建多分支局部注意力網(wǎng)絡(luò)的車輛分類模型進(jìn)行訓(xùn)練,所述多分支局部注意力網(wǎng)絡(luò)包括基于通道的卷積注意力模塊,以及基于空間的局部注意力模塊的具體步驟包括:
基于ResNet-50模型構(gòu)建多分支局部注意力網(wǎng)絡(luò)結(jié)構(gòu);
利用基于通道的卷積注意力模塊引入作為第一個(gè)分支;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于合肥市正茂科技有限公司,未經(jīng)合肥市正茂科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110881344.8/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書(shū)寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫(huà)組成的,而且每個(gè)筆畫(huà)表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 基于粒子濾波視覺(jué)注意力模型的運(yùn)動(dòng)目標(biāo)檢測(cè)方法
- 一種評(píng)測(cè)注意力狀態(tài)的方法及裝置
- 注意力測(cè)評(píng)方法、系統(tǒng)及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 兒童注意力評(píng)估系統(tǒng)及其方法
- 一種注意力檢測(cè)方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種注意力識(shí)別方法和裝置
- 一種可靠的用戶注意力監(jiān)測(cè)估計(jì)表示模型
- 注意力特征圖獲取方法及裝置、目標(biāo)檢測(cè)的方法及裝置
- 基于通道增強(qiáng)的雙注意力生成對(duì)抗網(wǎng)絡(luò)及圖像生成方法
- 一種文本情感分析模型的優(yōu)化方法及裝置





