[發(fā)明專利]神經(jīng)網(wǎng)絡(luò)模型壓縮方法、裝置和計(jì)算機(jī)設(shè)備在審
| 申請(qǐng)?zhí)枺?/td> | 201811037330.2 | 申請(qǐng)日: | 2018-09-05 |
| 公開(公告)號(hào): | CN109165720A | 公開(公告)日: | 2019-01-08 |
| 發(fā)明(設(shè)計(jì))人: | 金玲玲;饒東升;何文瑋 | 申請(qǐng)(專利權(quán))人: | 深圳靈圖慧視科技有限公司 |
| 主分類號(hào): | G06N3/00 | 分類號(hào): | G06N3/00;G06N3/08 |
| 代理公司: | 暫無(wú)信息 | 代理人: | 暫無(wú)信息 |
| 地址: | 518000 廣東省深圳市*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 神經(jīng)網(wǎng)絡(luò)模型 計(jì)算機(jī)設(shè)備 壓縮層 計(jì)算機(jī)可讀介質(zhì) 遺傳算法 壓縮 排序 壓縮方法及裝置 存儲(chǔ)空間 計(jì)算資源 訓(xùn)練樣本 壓縮處理 預(yù)設(shè)規(guī)則 計(jì)算量 受限 預(yù)設(shè) 預(yù)置 存儲(chǔ) 申請(qǐng) 應(yīng)用 | ||
本申請(qǐng)公開了神經(jīng)網(wǎng)絡(luò)模型壓縮方法及裝置、計(jì)算機(jī)設(shè)備及計(jì)算機(jī)可讀介質(zhì),該方法包括:獲取經(jīng)訓(xùn)練后的第一神經(jīng)網(wǎng)絡(luò)模型;從第一神經(jīng)網(wǎng)絡(luò)模型的各層中選取至少一層作為待壓縮層;按照預(yù)設(shè)規(guī)則對(duì)待壓縮層進(jìn)行排序;根據(jù)排序的先后順序,利用遺傳算法對(duì)待壓縮層的部分或全部執(zhí)行壓縮處理以獲得第二神經(jīng)網(wǎng)絡(luò)模型,其中,第二神經(jīng)網(wǎng)絡(luò)模型基于預(yù)置的訓(xùn)練樣本的精度不低于預(yù)設(shè)精度。該方法及裝置、計(jì)算機(jī)設(shè)備及計(jì)算機(jī)可讀介質(zhì)利用遺傳算法對(duì)已經(jīng)訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)模型進(jìn)行壓縮,降低了神經(jīng)網(wǎng)絡(luò)模型的計(jì)算量和存儲(chǔ)空間,使其能應(yīng)用于存儲(chǔ)和計(jì)算資源都受限的設(shè)備,并能同時(shí)兼顧神經(jīng)網(wǎng)絡(luò)模型的精度和壓縮。
技術(shù)領(lǐng)域
本申請(qǐng)涉及計(jì)算機(jī)應(yīng)用技術(shù)領(lǐng)域,尤其涉及一種神經(jīng)網(wǎng)絡(luò)模型壓縮方法及裝置、計(jì)算機(jī)設(shè)備及計(jì)算機(jī)可讀介質(zhì)。
背景技術(shù)
近年來(lái),隨著人工智能的發(fā)展,神經(jīng)網(wǎng)絡(luò)(Neural Network,NN)算法被廣泛應(yīng)用于圖像處理,語(yǔ)音識(shí)別,自然語(yǔ)言處理等多個(gè)領(lǐng)域。然而,效果較好的深度神經(jīng)網(wǎng)絡(luò)往往有著數(shù)量較大的節(jié)點(diǎn)(神經(jīng)元)和模型參數(shù),不僅計(jì)算量大而且在實(shí)際部署中模型占據(jù)較大一部分空間,限制了其應(yīng)用于存儲(chǔ)和計(jì)算資源都受限的設(shè)備。因此,如何對(duì)神經(jīng)網(wǎng)絡(luò)模型進(jìn)行壓縮顯得尤為重要,特別是對(duì)已經(jīng)訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)模型進(jìn)行壓縮,將有利于把訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)模型應(yīng)用到諸如嵌入式設(shè)備、集成硬件設(shè)備中等應(yīng)用場(chǎng)景。
發(fā)明內(nèi)容
鑒于以上問題,本發(fā)明的實(shí)施例提供一種神經(jīng)網(wǎng)絡(luò)模型壓縮方法及裝置、計(jì)算機(jī)設(shè)備及計(jì)算機(jī)可讀介質(zhì),其能對(duì)已經(jīng)訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)模型進(jìn)行壓縮,降低神經(jīng)網(wǎng)絡(luò)模型的計(jì)算量和存儲(chǔ)空間,使神經(jīng)網(wǎng)絡(luò)模型能應(yīng)用于存儲(chǔ)和計(jì)算資源受限的設(shè)備。
按照本發(fā)明的實(shí)施例的神經(jīng)網(wǎng)絡(luò)模型壓縮方法,包括:獲取經(jīng)訓(xùn)練后的第一神經(jīng)網(wǎng)絡(luò)模型;從第一神經(jīng)網(wǎng)絡(luò)模型的各層中選取至少一層作為待壓縮層;按照預(yù)設(shè)規(guī)則對(duì)待壓縮層進(jìn)行排序;根據(jù)排序的先后順序,利用遺傳算法對(duì)待壓縮層的部分或全部執(zhí)行壓縮處理以獲得第二神經(jīng)網(wǎng)絡(luò)模型,其中,第二神經(jīng)網(wǎng)絡(luò)模型基于預(yù)置的訓(xùn)練樣本的精度不低于預(yù)設(shè)精度。
按照本發(fā)明的實(shí)施例的神經(jīng)網(wǎng)絡(luò)模型壓縮裝置,包括:獲取模塊,用于獲取經(jīng)訓(xùn)練后的第一神經(jīng)網(wǎng)絡(luò)模型;選取模塊,用于從第一神經(jīng)網(wǎng)絡(luò)模型的各層中選取至少一層作為待壓縮層;排序模塊,用于按照預(yù)設(shè)規(guī)則對(duì)待壓縮層進(jìn)行排序;壓縮模塊,用于根據(jù)排序的先后順序,利用遺傳算法對(duì)待壓縮層的部分或全部執(zhí)行壓縮處理以獲得第二神經(jīng)網(wǎng)絡(luò)模型,其中,第二神經(jīng)網(wǎng)絡(luò)模型基于預(yù)置的訓(xùn)練樣本的精度不低于預(yù)設(shè)精度。
按照本發(fā)明的實(shí)施例的計(jì)算機(jī)設(shè)備,包括:處理器;以及存儲(chǔ)器,其上存儲(chǔ)有可執(zhí)行指令,其中,所述可執(zhí)行指令當(dāng)被執(zhí)行時(shí)使得所述處理器執(zhí)行前述的方法。
按照本發(fā)明的實(shí)施例的計(jì)算機(jī)可讀介質(zhì),其上存儲(chǔ)有可執(zhí)行指令,其中,所述可執(zhí)行指令當(dāng)被執(zhí)行時(shí)使得計(jì)算機(jī)執(zhí)行前述的方法。
從以上的描述可以看出,本發(fā)明的實(shí)施例的方案利用遺傳算法對(duì)已經(jīng)訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)模型進(jìn)行壓縮,降低了神經(jīng)網(wǎng)絡(luò)模型的計(jì)算量和存儲(chǔ)空間,使其能應(yīng)用于存儲(chǔ)和計(jì)算資源都受限的設(shè)備。并且,本發(fā)明的實(shí)施例的方案能同時(shí)兼顧神經(jīng)網(wǎng)絡(luò)模型的精度和壓縮。
附圖說(shuō)明
圖1為本發(fā)明的實(shí)施例可以應(yīng)用于其中的示例性架構(gòu)圖;
圖2為按照本發(fā)明的一個(gè)實(shí)施例的神經(jīng)網(wǎng)絡(luò)模型壓縮方法的流程圖;
圖3為按照本發(fā)明的一個(gè)實(shí)施例的利用遺傳算法對(duì)待壓縮層執(zhí)行壓縮處理的方法的流程圖;
圖3a為一神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的示例圖;
圖4為按照本發(fā)明的一個(gè)實(shí)施例的神經(jīng)網(wǎng)絡(luò)模型壓縮裝置的流程圖;
圖5為按照本發(fā)明的一個(gè)實(shí)施例的計(jì)算機(jī)設(shè)備的示意圖;
圖6為按照本發(fā)明的一個(gè)實(shí)施例的適于用來(lái)實(shí)現(xiàn)本發(fā)明實(shí)施方式的示例性計(jì)算機(jī)設(shè)備的框圖。
具體實(shí)施方式
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳靈圖慧視科技有限公司,未經(jīng)深圳靈圖慧視科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811037330.2/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 一種對(duì)神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練的方法、裝置及電子設(shè)備
- 一種神經(jīng)網(wǎng)絡(luò)模型壓縮方法以及裝置
- 姿態(tài)檢測(cè)方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于無(wú)標(biāo)簽數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)模型量化方法及裝置
- 神經(jīng)網(wǎng)絡(luò)模型更新方法、圖像處理方法及裝置
- 含有聚類拓?fù)漶詈系纳窠?jīng)網(wǎng)絡(luò)脈沖同步方法及系統(tǒng)
- 一種神經(jīng)網(wǎng)絡(luò)模型的部署方法、設(shè)備及介質(zhì)
- 神經(jīng)網(wǎng)絡(luò)模型的優(yōu)化方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于框架搜索的深度神經(jīng)網(wǎng)絡(luò)的加速與壓縮方法及系統(tǒng)
- 一種神經(jīng)網(wǎng)絡(luò)模型生成方法及裝置
- 在分布式數(shù)據(jù)庫(kù)系統(tǒng)中管理查詢
- 設(shè)備間互動(dòng)虛擬角色系統(tǒng)
- 計(jì)算機(jī)虛擬角色拿取系統(tǒng)
- 用于向計(jì)算機(jī)設(shè)備供電的燃料電池
- 虛擬角色同步更新式傳輸系統(tǒng)
- 虛擬角色自行傳輸?shù)挠?jì)算機(jī)交互系統(tǒng)
- 虛擬角色傳輸系統(tǒng)
- 計(jì)算機(jī)設(shè)備的啟動(dòng)方法、裝置及計(jì)算機(jī)設(shè)備
- 一種基于區(qū)塊鏈技術(shù)的計(jì)算機(jī)設(shè)備防盜系統(tǒng)及方法
- 一種用于計(jì)算機(jī)設(shè)備管理的終端
- 通過下載證書來(lái)控制對(duì)計(jì)算機(jī)可讀內(nèi)容的訪問的系統(tǒng)及方法
- 用于生產(chǎn)組合物的監(jiān)測(cè)設(shè)備
- 計(jì)算機(jī)可讀的掩模收縮控制處理器
- 用于動(dòng)態(tài)授權(quán)對(duì)被許可內(nèi)容的訪問的方法、系統(tǒng)和產(chǎn)品
- 監(jiān)視和控制計(jì)算機(jī)可讀介質(zhì)上的數(shù)據(jù)的訪問的裝置和方法
- 光電子模塊和用于操作所述光電子模塊的方法
- 用于將操作系統(tǒng)存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)上的BIOS代碼
- 相機(jī)組同步曝光控制方法及系統(tǒng)、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)、相機(jī)組控制系統(tǒng)
- 炒鍋翻炒方法、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)及智能炒菜機(jī)
- 用于計(jì)算機(jī)系統(tǒng)啟動(dòng)操作的系統(tǒng)及方法





