[發(fā)明專利]一種建立圖像分類神經(jīng)網(wǎng)絡(luò)模型及圖像分類方法、裝置有效
| 申請?zhí)枺?/td> | 201810415434.6 | 申請日: | 2018-05-03 |
| 公開(公告)號: | CN108805166B | 公開(公告)日: | 2019-11-15 |
| 發(fā)明(設(shè)計)人: | 吳鵬;張強(qiáng);林國強(qiáng);陳其鵬;王岳;韓強(qiáng);王揚(yáng);楊青 | 申請(專利權(quán))人: | 全球能源互聯(lián)網(wǎng)研究院有限公司;國網(wǎng)天津市電力公司;國家電網(wǎng)有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 11250 北京三聚陽光知識產(chǎn)權(quán)代理有限公司 | 代理人: | 李博洋<國際申請>=<國際公布>=<進(jìn)入 |
| 地址: | 102209北京市*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 圖像分類 神經(jīng)網(wǎng)絡(luò)模型 卷積神經(jīng)網(wǎng)絡(luò) 訓(xùn)練集 積層 分類圖像數(shù)據(jù) 分類圖像 生成圖像 特征圖 分類 網(wǎng)絡(luò) | ||
本發(fā)明實施例提供了一種建立圖像分類神經(jīng)網(wǎng)絡(luò)模型及圖像分類方法、裝置,該建立圖像分類神經(jīng)網(wǎng)絡(luò)模型的方法中,首先獲取包含已分類圖像的訓(xùn)練集,然后根據(jù)密集連接卷積神經(jīng)網(wǎng)絡(luò)模型的密集塊中各卷積層之間的距離,確定輸入密集塊中各卷積層的特征圖的數(shù)量,形成第二密集連接卷積神經(jīng)網(wǎng)絡(luò)模型,并使用訓(xùn)練集對該第二密集連接卷積神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,生成圖像分類神經(jīng)網(wǎng)絡(luò)模型,然后使用該圖像分類神經(jīng)網(wǎng)絡(luò)模型對待分類圖像數(shù)據(jù)進(jìn)行分類。本發(fā)明實施例降低了圖像分類過程中的網(wǎng)絡(luò)參數(shù)量。
技術(shù)領(lǐng)域
本發(fā)明涉及圖像處理技術(shù)領(lǐng)域,具體涉及一種建立圖像分類神經(jīng)網(wǎng)絡(luò)模型及圖像分類方法、裝置。
背景技術(shù)
圖像分類技術(shù)在字符識別、人臉識別、物體識別、行人檢測、圖像檢索等方面都有廣泛的應(yīng)用。圖像分類的主要思想是:首先對樣本圖像中所包含的目標(biāo)或者場景進(jìn)行分析,然后將圖像的原始像素轉(zhuǎn)換為圖像的特征信息,用這些特征信息表示成各個圖像的描述信息,最后根據(jù)得到的這些描述信息進(jìn)行圖像分類。傳統(tǒng)的圖像分類的方法有局限性,需要分別進(jìn)行圖像特征提取和分類,而且圖像特征的提取是圖像準(zhǔn)確分類的前提,因此提取到的特征必須是對整幅圖像的完整描述,如果特征提取方法錯誤或圖像特征提取不充分,分類的準(zhǔn)確性便不能得到保障,甚至?xí)?dǎo)致無法分類。
目前,DCNN(深度卷積神經(jīng)網(wǎng)絡(luò))已經(jīng)成為圖像分類的主流方法,它是通過模擬人類的視覺系統(tǒng)來產(chǎn)生分類結(jié)果的,將特征提取與圖像分類融合在了一起。Densenet(密集連接卷積神經(jīng)網(wǎng)絡(luò))以DCNN為基礎(chǔ),其主要思想是:網(wǎng)絡(luò)中每一層都接收其前部所有層的輸出特征圖作為輸入,這樣每一層都重新在其之前所有層的輸出中提取有用信息,但隨著網(wǎng)絡(luò)寬度的加寬以及深度的加深,網(wǎng)絡(luò)的參數(shù)量會發(fā)生爆炸性增長。
發(fā)明內(nèi)容
鑒于上述的分析,本發(fā)明實施例提出了一種建立圖像分類神經(jīng)網(wǎng)絡(luò)模型及圖像分類方法、裝置,用以解決現(xiàn)有密集連接卷積神經(jīng)網(wǎng)絡(luò),隨著網(wǎng)絡(luò)寬度的加寬以及深度的加深,網(wǎng)絡(luò)的參數(shù)量會發(fā)生爆炸性增長的問題。
為實現(xiàn)上述目的,本發(fā)明采用如下技術(shù)方案:
根據(jù)第一方面,本發(fā)明實施例提供一種建立圖像分類神經(jīng)網(wǎng)絡(luò)模型的方法,該建立圖像分類神經(jīng)網(wǎng)絡(luò)模型的方法包括:獲取包含已分類圖像的訓(xùn)練集;根據(jù)密集連接卷積神經(jīng)網(wǎng)絡(luò)模型的密集塊中各卷積層之間的距離,確定輸入密集塊中各卷積層的特征圖的數(shù)量,形成第二密集連接卷積神經(jīng)網(wǎng)絡(luò)模型;使用訓(xùn)練集對第二密集連接卷積神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,生成圖像分類神經(jīng)網(wǎng)絡(luò)模型。
結(jié)合第一方面,在第一方面第一實施方式中,根據(jù)密集連接卷積神經(jīng)網(wǎng)絡(luò)模型的密集塊中各卷積層之間的距離,確定輸入密集塊中各卷積層的特征圖的數(shù)量,形成第二密集連接卷積神經(jīng)網(wǎng)絡(luò)模型,包括:獲取密集塊中各卷積層之間的距離和相鄰兩個卷積層之間傳遞的特征圖的數(shù)量;根據(jù)密集塊中各卷積層之間的距離和相鄰兩個卷積層之間傳遞的特征圖的數(shù)量,確定輸入密集塊各卷積層的特征圖數(shù)量增長率;根據(jù)該增長率,確定輸入密集塊中各卷積層的特征圖的數(shù)量,形成第二密集連接卷積神經(jīng)網(wǎng)絡(luò)模型。
結(jié)合第一方面第一實施方式,在第一方面第二實施方式中,通過如下公式確定輸入密集塊各卷積層的特征圖數(shù)量增長率G:
其中,ΔL表示密集塊中第一層卷積層與最后一層卷積層之間的距離,h表示相鄰兩個卷積層之間的距離,s表示第一層卷積層輸出的特征圖的數(shù)量,s0表示相鄰兩個卷積層之間傳遞的特征圖的數(shù)量。
結(jié)合第一方面第二實施方式,在第一方面第三實施方式中,通過如下公式確定輸入密集塊中各卷積層的特征圖的數(shù)量,sL表示輸入第L層卷積層的特征圖的數(shù)量,L為大于等于2的正整數(shù):
其中,s1表示輸入密集塊第一層卷積層的特征圖的數(shù)量,l表示向第L層卷積層輸入特征圖的卷積層。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于全球能源互聯(lián)網(wǎng)研究院有限公司;國網(wǎng)天津市電力公司;國家電網(wǎng)有限公司,未經(jīng)全球能源互聯(lián)網(wǎng)研究院有限公司;國網(wǎng)天津市電力公司;國家電網(wǎng)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810415434.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 圖像中的對象的自動分類
- 將圖像分類為廣告圖像或非廣告圖像
- 基于場景的圖像分類方法、裝置、系統(tǒng)和存儲介質(zhì)
- 一種圖像分類的方法、裝置和存儲介質(zhì)
- 圖像分類方法、裝置、計算機(jī)設(shè)備和存儲介質(zhì)
- 圖像分類模型的訓(xùn)練方法、裝置、計算機(jī)設(shè)備及存儲介質(zhì)
- 圖像分類模型訓(xùn)練方法、裝置、計算機(jī)設(shè)備及存儲介質(zhì)
- 圖像分類模型的訓(xùn)練方法、裝置、電子設(shè)備及存儲介質(zhì)
- 一種圖像分類方法、裝置、電子設(shè)備及存儲介質(zhì)
- 一種圖像分類方法、裝置、電子設(shè)備及存儲介質(zhì)
- 一種對神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練的方法、裝置及電子設(shè)備
- 一種神經(jīng)網(wǎng)絡(luò)模型壓縮方法以及裝置
- 姿態(tài)檢測方法、裝置、設(shè)備及存儲介質(zhì)
- 基于無標(biāo)簽數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)模型量化方法及裝置
- 神經(jīng)網(wǎng)絡(luò)模型更新方法、圖像處理方法及裝置
- 含有聚類拓?fù)漶詈系纳窠?jīng)網(wǎng)絡(luò)脈沖同步方法及系統(tǒng)
- 一種神經(jīng)網(wǎng)絡(luò)模型的部署方法、設(shè)備及介質(zhì)
- 神經(jīng)網(wǎng)絡(luò)模型的優(yōu)化方法、裝置、設(shè)備及存儲介質(zhì)
- 基于框架搜索的深度神經(jīng)網(wǎng)絡(luò)的加速與壓縮方法及系統(tǒng)
- 一種神經(jīng)網(wǎng)絡(luò)模型生成方法及裝置
- 終端卷積神經(jīng)網(wǎng)絡(luò)的處理方法、裝置、存儲介質(zhì)及處理器
- 一種基于卷積神經(jīng)網(wǎng)絡(luò)的圖像深度估計方法
- 卷積神經(jīng)網(wǎng)絡(luò)的生成方法及裝置
- 一種卷積神經(jīng)網(wǎng)絡(luò)硬件模塊部署方法
- 卷積神經(jīng)網(wǎng)絡(luò)的處理方法、裝置、設(shè)備及存儲介質(zhì)
- 一種卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法及裝置
- 一種基于通道數(shù)搜索卷積神經(jīng)網(wǎng)絡(luò)的方法
- 卷積神經(jīng)網(wǎng)絡(luò)處理方法、裝置和電子系統(tǒng)
- 一種基于空洞卷積循環(huán)神經(jīng)網(wǎng)絡(luò)的聲音事件檢測方法
- 基于稀疏卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測方法及檢測裝置
- 一種訓(xùn)練集的拆分方法及裝置
- 一種訓(xùn)練集的訓(xùn)練方法及裝置
- 多重半監(jiān)督圖像的季節(jié)分類方法、系統(tǒng)、電子設(shè)備和介質(zhì)
- 一種基于特征分布的訓(xùn)練集生成、模型訓(xùn)練方法及裝置
- 訓(xùn)練集的獲取方法、裝置及電子設(shè)備
- 選擇模型訓(xùn)練方法、模型選擇方法、裝置及電子設(shè)備
- 一種工業(yè)物聯(lián)網(wǎng)下的模型智能訓(xùn)練方法
- 一種基于集成學(xué)習(xí)的深度學(xué)習(xí)缺陷圖像識別方法及系統(tǒng)
- 一種基于最優(yōu)訓(xùn)練集的深度學(xué)習(xí)圖像分類方法及系統(tǒng)
- 一種文本立場檢測方法





