[發(fā)明專利]一種卷積神經(jīng)網(wǎng)絡(luò)模型的訓練方法及其設(shè)備有效
| 申請?zhí)枺?/td> | 201710021101.0 | 申請日: | 2017-01-11 |
| 公開(公告)號: | CN106778682B | 公開(公告)日: | 2019-07-09 |
| 發(fā)明(設(shè)計)人: | 陳書楷;楊奇 | 申請(專利權(quán))人: | 廈門中控智慧信息技術(shù)有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62;G06N3/04 |
| 代理公司: | 深圳市深佳知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 44285 | 代理人: | 王仲凱 |
| 地址: | 361008 福建省廈門*** | 國省代碼: | 福建;35 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 卷積 神經(jīng)網(wǎng)絡(luò) 模型 訓練 方法 及其 設(shè)備 | ||
本發(fā)明實施例公開了一種卷積神經(jīng)網(wǎng)絡(luò)模型的訓練方法及其設(shè)備,用于通過對預置的卷積神經(jīng)網(wǎng)絡(luò)模型的訓練得到更新的卷積神經(jīng)網(wǎng)絡(luò)模型。本發(fā)明實施例方法包括:獲取人臉圖像;使用預置的卷積神經(jīng)網(wǎng)絡(luò)模型對所述人臉圖像進行圖像訓練,得到屬性判斷結(jié)果,所述屬性判斷結(jié)果包括多個屬性以及所述多個屬性中的每一個屬性所對應(yīng)的概率;通過交叉熵函數(shù)和所述人臉圖像的真實屬性對所述屬性判斷結(jié)果進行評價,得到評價結(jié)果;根據(jù)所述評價結(jié)果更新所述卷積神經(jīng)網(wǎng)絡(luò)模型中各個參數(shù)的權(quán)重,得到更新后的卷積神經(jīng)網(wǎng)絡(luò)模型。
技術(shù)領(lǐng)域
本發(fā)明涉及圖像處理領(lǐng)域,尤其涉及一種卷積神經(jīng)網(wǎng)絡(luò)模型的訓練方法及其設(shè)備。
背景技術(shù)
卷積神經(jīng)網(wǎng)絡(luò)(英文:Convolutional Neural Network;縮寫:CNN)是一種前饋神經(jīng)網(wǎng)絡(luò),它的人工神經(jīng)元可以響應(yīng)一部分覆蓋范圍內(nèi)的周圍單元,對于大型圖像處理有出色表現(xiàn)。它包括卷積層(英文:alternating convolutional layer)、最大池化層(英文:pooling layer)和全連層。
CNN網(wǎng)絡(luò)模型主要用來識別位移、縮放及其他形式扭曲不變性的二維圖形,CNN的特征檢測層通過訓練數(shù)據(jù)進行學習。卷積神經(jīng)網(wǎng)絡(luò)以其局部權(quán)值共享的特殊結(jié)構(gòu)在語音識別和圖像處理方面有著獨特的優(yōu)越性,其布局更接近于實際的生物神經(jīng)網(wǎng)絡(luò),權(quán)值共享降低了網(wǎng)絡(luò)的復雜性,特別是多維輸入向量的圖像可以直接輸入網(wǎng)絡(luò)這一特點避免了特征提取和分類過程中數(shù)據(jù)重建的復雜度。
然而,若僅通過預先設(shè)計的CNN網(wǎng)絡(luò)模型對圖像進行訓練,沒有對自身的參數(shù)進行更新或修正的機制,因此無法通過自動更新其參數(shù)的權(quán)重得到性能更優(yōu)異的CNN網(wǎng)絡(luò)模型。
發(fā)明內(nèi)容
本發(fā)明實施例提供了一種卷積神經(jīng)網(wǎng)絡(luò)模型的訓練方法及其設(shè)備,用于通過對預置的卷積神經(jīng)網(wǎng)絡(luò)模型的訓練得到更新的卷積神經(jīng)網(wǎng)絡(luò)模型。
本發(fā)明第一方面提供了一種卷積神經(jīng)網(wǎng)絡(luò)模型的訓練方法,包括:
獲取人臉圖像;使用預置的卷積神經(jīng)網(wǎng)絡(luò)模型對該人臉圖像進行圖像訓練,得到屬性判斷結(jié)果,該屬性判斷結(jié)果包括多個屬性以及該多個屬性中的每一個屬性所對應(yīng)的概率;通過交叉熵函數(shù)和該人臉圖像的真實屬性對該屬性判斷結(jié)果進行評價,得到評價結(jié)果;根據(jù)該評價結(jié)果更新該卷積神經(jīng)網(wǎng)絡(luò)模型中各個參數(shù)的權(quán)重,得到更新后的卷積神經(jīng)網(wǎng)絡(luò)模型。
結(jié)合本發(fā)明第一方面,本發(fā)明第一方面的第一種實施方式,包括:
對該人臉圖像進行人臉對齊,得到對齊后的人臉圖像;使用該卷積神經(jīng)網(wǎng)絡(luò)模型對該對齊后的人臉圖像進行訓練。
結(jié)合本發(fā)明第一方面,本發(fā)明第一方面的第二種實施方式,包括:
對該人臉圖像進行圖像張量化,得到圖像張量化后的人臉圖像;使用預置的卷積神經(jīng)網(wǎng)絡(luò)模型對該圖像張量化后的人臉圖像進行圖像訓練。
可選的,該卷積神經(jīng)網(wǎng)絡(luò)模型的卷積層的卷積核的大小為3×3的濾波器,卷積步長為1,且該卷積神經(jīng)網(wǎng)絡(luò)模型中的最大池化層的步長為2,采樣滑動窗口為2×2。
可選的,該卷積神經(jīng)網(wǎng)絡(luò)模型包括5層卷積層、5層最大池化層和2層全連層。
可選的,該卷積神經(jīng)網(wǎng)絡(luò)模型中的該5層卷積層、該5層最大池化層和該2層全連層依次為:第一卷積層、第一最大池化層、第二卷積層、第二最大池化層、第三卷積層、第三最大池化層、第四卷積層、第四最大池化層、第五卷積層、第五最大池化層、第一全連層、第二全連層。
結(jié)合本發(fā)明第一方面,本發(fā)明第一方面的第三種實施方式,包括:
使用該卷積神經(jīng)網(wǎng)絡(luò)模型對該人臉圖像進行圖像訓練,得到預置個數(shù)的矩陣;使用分類算法預估該預置個數(shù)的矩陣中的各個矩陣所對應(yīng)的該多個屬性中的各個屬性的概率分布;根據(jù)該多個屬性中的各個屬性的概率分布估計該人臉圖像的屬性。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廈門中控智慧信息技術(shù)有限公司,未經(jīng)廈門中控智慧信息技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710021101.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
- 卷積運算處理方法及相關(guān)產(chǎn)品
- 一種卷積神經(jīng)網(wǎng)絡(luò)的計算方法及系統(tǒng)
- 卷積運算方法及系統(tǒng)
- 卷積運算方法、裝置及系統(tǒng)
- 深度神經(jīng)網(wǎng)絡(luò)裁剪方法、裝置及電子設(shè)備
- 基于卷積神經(jīng)網(wǎng)絡(luò)的圖像處理方法和圖像處理裝置
- 卷積神經(jīng)網(wǎng)絡(luò)及基于卷積神經(jīng)網(wǎng)絡(luò)的圖像處理方法
- 一種圖像處理方法、裝置以及計算機存儲介質(zhì)
- 用于卷積神經(jīng)網(wǎng)絡(luò)的卷積運算裝置
- 基于FPGA實現(xiàn)圖像識別的方法、裝置、設(shè)備及存儲介質(zhì)
- 硬件神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法、計算裝置、軟硬件協(xié)作系統(tǒng)
- 生成較大神經(jīng)網(wǎng)絡(luò)
- 神經(jīng)網(wǎng)絡(luò)的生成方法、生成裝置和電子設(shè)備
- 一種舌診方法、裝置、計算設(shè)備及計算機存儲介質(zhì)
- 學習神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
- 脈沖神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法及相關(guān)轉(zhuǎn)換芯片
- 圖像處理方法、裝置、可讀存儲介質(zhì)和計算機設(shè)備
- 一種適應(yīng)目標數(shù)據(jù)集的網(wǎng)絡(luò)模型微調(diào)方法、系統(tǒng)、終端和存儲介質(zhì)
- 用于重構(gòu)人工神經(jīng)網(wǎng)絡(luò)的處理器及其操作方法、電氣設(shè)備
- 一種圖像神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的優(yōu)化方法及裝置





