[發(fā)明專利]深度神經(jīng)網(wǎng)絡(luò)模型的壓縮方法及裝置、終端、存儲(chǔ)介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 201710266304.6 | 申請(qǐng)日: | 2017-04-21 |
| 公開(kāi)(公告)號(hào): | CN108734266A | 公開(kāi)(公告)日: | 2018-11-02 |
| 發(fā)明(設(shè)計(jì))人: | 林福輝;趙曉輝 | 申請(qǐng)(專利權(quán))人: | 展訊通信(上海)有限公司 |
| 主分類號(hào): | G06N3/04 | 分類號(hào): | G06N3/04 |
| 代理公司: | 北京集佳知識(shí)產(chǎn)權(quán)代理有限公司 11227 | 代理人: | 郭學(xué)秀;吳敏 |
| 地址: | 201203 上海市浦東新區(qū)浦東*** | 國(guó)省代碼: | 上海;31 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 神經(jīng)網(wǎng)絡(luò)模型 預(yù)設(shè) 壓縮方法及裝置 存儲(chǔ)介質(zhì) 迭代量化 壓縮 終端 精度需求 貢獻(xiàn)度 量化 | ||
一種深度神經(jīng)網(wǎng)絡(luò)模型的壓縮方法及裝置、終端、存儲(chǔ)介質(zhì),所述方法包括:基于所獲取的深度神經(jīng)網(wǎng)絡(luò)模型中各層的精簡(jiǎn)單元的貢獻(xiàn)度的信息,對(duì)所述深度神經(jīng)網(wǎng)絡(luò)模型進(jìn)行精簡(jiǎn),直至精簡(jiǎn)后的深度神經(jīng)網(wǎng)絡(luò)模型滿足預(yù)設(shè)的精度需求;對(duì)所述精簡(jiǎn)后的深度神經(jīng)網(wǎng)絡(luò)模型進(jìn)行重新訓(xùn)練,得到重新訓(xùn)練后的深度神經(jīng)網(wǎng)絡(luò)模型;當(dāng)確定重新訓(xùn)練后的深度神經(jīng)網(wǎng)絡(luò)模型不滿足預(yù)設(shè)的壓縮體積需求時(shí),對(duì)重新訓(xùn)練后的深度神經(jīng)網(wǎng)絡(luò)模型中的各層參數(shù)進(jìn)行迭代量化;對(duì)重新訓(xùn)練后的深度神經(jīng)網(wǎng)絡(luò)模型進(jìn)行N次迭代量化,直至量化后的深度神經(jīng)網(wǎng)絡(luò)模型滿足預(yù)設(shè)的壓縮體積需求。上述的方案,可以是在對(duì)深度神經(jīng)網(wǎng)絡(luò)模型壓縮時(shí),兼顧深度神經(jīng)網(wǎng)絡(luò)模型的精度及有效性。
技術(shù)領(lǐng)域
本發(fā)明涉及信息處理技術(shù)領(lǐng)域,尤其涉及一種深度神經(jīng)網(wǎng)絡(luò)模型的壓縮方法及裝置、終端、存儲(chǔ)介質(zhì)。
背景技術(shù)
隨著深度神經(jīng)網(wǎng)絡(luò)相關(guān)技術(shù)研究的迅速發(fā)展,相關(guān)領(lǐng)域內(nèi)涌現(xiàn)了大批與深度神經(jīng)網(wǎng)絡(luò)相關(guān)的技術(shù),如應(yīng)用于視覺(jué)領(lǐng)域的卷積神經(jīng)網(wǎng)絡(luò)和應(yīng)用于語(yǔ)音識(shí)別或自然語(yǔ)言處理領(lǐng)域的遞歸神經(jīng)網(wǎng)絡(luò)等,這些神經(jīng)網(wǎng)絡(luò)技術(shù)均極大地提高了相應(yīng)領(lǐng)域的處理精度。
深度神經(jīng)網(wǎng)絡(luò)與淺層學(xué)習(xí)相比,深度神經(jīng)網(wǎng)絡(luò)的開(kāi)發(fā)潛力巨大。通過(guò)深度神經(jīng)網(wǎng)絡(luò)模型的多層處理結(jié)構(gòu)可以提取和分析樣本的表征特征,由淺入深地逐層變換和計(jì)算樣本特征并計(jì)算處理結(jié)果。通過(guò)對(duì)深度神經(jīng)網(wǎng)絡(luò)模型進(jìn)行增寬增長(zhǎng)處理,可以使深度神經(jīng)網(wǎng)絡(luò)模型獲得相對(duì)更優(yōu)的處理結(jié)果。
然而,深度神經(jīng)網(wǎng)絡(luò)模型的參數(shù)通常在百萬(wàn)、千萬(wàn)或上億數(shù)量級(jí),因此對(duì)計(jì)算和存儲(chǔ)設(shè)備的要求較高。由于深度神經(jīng)網(wǎng)絡(luò)模型存儲(chǔ)及計(jì)算時(shí)深度神經(jīng)網(wǎng)絡(luò)模型的參數(shù)傳輸?shù)葐?wèn)題,限制了深度神經(jīng)網(wǎng)絡(luò)模型在移動(dòng)設(shè)備上的應(yīng)用。
目前,通常采用減少深度神經(jīng)網(wǎng)絡(luò)模型的參數(shù)、節(jié)點(diǎn)數(shù)目以及改變多樣性類方法,達(dá)到壓縮深度神經(jīng)網(wǎng)絡(luò)模型的目的。雖然,這樣可以對(duì)神經(jīng)網(wǎng)絡(luò)模型進(jìn)行一定的壓縮,然而,精簡(jiǎn)后的深度神經(jīng)網(wǎng)絡(luò)模型的精度及有效性較低。
發(fā)明內(nèi)容
本發(fā)明解決的技術(shù)問(wèn)題是在對(duì)深度神經(jīng)網(wǎng)絡(luò)模型壓縮時(shí)如何兼顧深度神經(jīng)網(wǎng)絡(luò)模型的精度及有效性。
為解決上述技術(shù)問(wèn)題,本發(fā)明實(shí)施例提供一種深度神經(jīng)網(wǎng)絡(luò)模型的壓縮方法,包括:獲取已訓(xùn)練的深度神經(jīng)網(wǎng)絡(luò)模型;基于所獲取的所述深度神經(jīng)網(wǎng)絡(luò)模型中各層的精簡(jiǎn)單元的貢獻(xiàn)度的信息,對(duì)所述深度神經(jīng)網(wǎng)絡(luò)模型進(jìn)行精簡(jiǎn),直至精簡(jiǎn)后的深度神經(jīng)網(wǎng)絡(luò)模型滿足預(yù)設(shè)的精度需求;對(duì)所述精簡(jiǎn)后的深度神經(jīng)網(wǎng)絡(luò)模型進(jìn)行重新訓(xùn)練,得到重新訓(xùn)練后的深度神經(jīng)網(wǎng)絡(luò)模型;當(dāng)確定重新訓(xùn)練后的深度神經(jīng)網(wǎng)絡(luò)模型不滿足預(yù)設(shè)的壓縮體積需求時(shí),分別采用各層對(duì)應(yīng)的預(yù)設(shè)量化等級(jí),對(duì)重新訓(xùn)練后的深度神經(jīng)網(wǎng)絡(luò)模型中的各層參數(shù)進(jìn)行迭代量化;所述迭代量化為對(duì)所述重新訓(xùn)練的所有層均進(jìn)行一次量化;對(duì)重新訓(xùn)練后的深度神經(jīng)網(wǎng)絡(luò)模型進(jìn)行N次迭代量化,直至量化后的深度神經(jīng)網(wǎng)絡(luò)模型滿足預(yù)設(shè)的壓縮體積需求。
可選地,所述基于所獲取的所述深度神經(jīng)網(wǎng)絡(luò)模型中各層的精簡(jiǎn)單元的貢獻(xiàn)度的信息,對(duì)所述深度神經(jīng)網(wǎng)絡(luò)模型進(jìn)行精簡(jiǎn),包括:采用驗(yàn)證集樣本對(duì)當(dāng)前次精簡(jiǎn)前的深度神經(jīng)網(wǎng)絡(luò)模型進(jìn)行測(cè)試,得到當(dāng)前次精簡(jiǎn)前的深度神經(jīng)網(wǎng)絡(luò)模型中各個(gè)精簡(jiǎn)單元?jiǎng)h除前后對(duì)應(yīng)的深度神經(jīng)網(wǎng)絡(luò)模型的精度改變數(shù)值;將當(dāng)前次精簡(jiǎn)前的深度神經(jīng)網(wǎng)絡(luò)模型中所有精簡(jiǎn)單元按照精度改變數(shù)值進(jìn)行排序;從當(dāng)前次精簡(jiǎn)前的深度神經(jīng)網(wǎng)絡(luò)模型中刪除預(yù)設(shè)數(shù)量的精度改變數(shù)值最小的精簡(jiǎn)單元,得到當(dāng)前次精簡(jiǎn)后的深度神經(jīng)網(wǎng)絡(luò)模型;判斷當(dāng)前次精簡(jiǎn)后的深度神經(jīng)網(wǎng)絡(luò)模型是否滿足所述精度需求;當(dāng)確定當(dāng)前次精簡(jiǎn)后的深度神經(jīng)網(wǎng)絡(luò)模型滿足所述精度需求時(shí),停止精簡(jiǎn)操作;當(dāng)確定所述當(dāng)前次精簡(jiǎn)后的深度神經(jīng)網(wǎng)絡(luò)模型不滿足所述精度需求時(shí),對(duì)當(dāng)前次精簡(jiǎn)后的深度神經(jīng)網(wǎng)絡(luò)模型執(zhí)行下一次精簡(jiǎn)操作,直至精簡(jiǎn)后的深度神經(jīng)網(wǎng)絡(luò)模型滿足所述精度需求。
可選地,所述采用驗(yàn)證集樣本對(duì)當(dāng)前次精簡(jiǎn)前的深度神經(jīng)網(wǎng)絡(luò)模型進(jìn)行測(cè)試,得到當(dāng)前次精簡(jiǎn)前的深度神經(jīng)網(wǎng)絡(luò)模型中各個(gè)精簡(jiǎn)單元?jiǎng)h除前后對(duì)應(yīng)的深度神經(jīng)網(wǎng)絡(luò)模型的精度改變數(shù)值,包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于展訊通信(上海)有限公司,未經(jīng)展訊通信(上海)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710266304.6/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 一種對(duì)神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練的方法、裝置及電子設(shè)備
- 一種神經(jīng)網(wǎng)絡(luò)模型壓縮方法以及裝置
- 姿態(tài)檢測(cè)方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于無(wú)標(biāo)簽數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)模型量化方法及裝置
- 神經(jīng)網(wǎng)絡(luò)模型更新方法、圖像處理方法及裝置
- 含有聚類拓?fù)漶詈系纳窠?jīng)網(wǎng)絡(luò)脈沖同步方法及系統(tǒng)
- 一種神經(jīng)網(wǎng)絡(luò)模型的部署方法、設(shè)備及介質(zhì)
- 神經(jīng)網(wǎng)絡(luò)模型的優(yōu)化方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于框架搜索的深度神經(jīng)網(wǎng)絡(luò)的加速與壓縮方法及系統(tǒng)
- 一種神經(jīng)網(wǎng)絡(luò)模型生成方法及裝置
- 用于接合與分離存儲(chǔ)介質(zhì)的裝置
- 存儲(chǔ)介質(zhì)陣列控制器、控制方法、設(shè)備、和存儲(chǔ)介質(zhì)驅(qū)動(dòng)器
- 存儲(chǔ)介質(zhì)處理方法、系統(tǒng)及數(shù)據(jù)讀寫(xiě)操作方法、系統(tǒng)
- 存儲(chǔ)裝置、存儲(chǔ)介質(zhì)以及存儲(chǔ)介質(zhì)的制造方法
- 數(shù)據(jù)存儲(chǔ)
- 存儲(chǔ)介質(zhì)之間的數(shù)據(jù)遷移
- 一種基于存儲(chǔ)系統(tǒng)的控制方法及裝置
- 自助設(shè)備及自助設(shè)備的介質(zhì)存儲(chǔ)裝置
- 融合存儲(chǔ)系統(tǒng)中的數(shù)據(jù)遷移方法和裝置
- 一種數(shù)據(jù)存儲(chǔ)方法、裝置及電子設(shè)備





