[發明專利]深度神經網絡DNN模型的壓縮方法、裝置、設備及介質在審
| 申請號: | 201711064586.8 | 申請日: | 2017-11-02 |
| 公開(公告)號: | CN107748915A | 公開(公告)日: | 2018-03-02 |
| 發明(設計)人: | 何金來;雷宇 | 申請(專利權)人: | 北京智能管家科技有限公司 |
| 主分類號: | G06N3/08 | 分類號: | G06N3/08 |
| 代理公司: | 北京品源專利代理有限公司11332 | 代理人: | 孟金喆 |
| 地址: | 101500 北京市密云區經濟開發*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 深度 神經網絡 dnn 模型 壓縮 方法 裝置 設備 介質 | ||
技術領域
本發明實施例涉及數據處理技術,尤其涉及一種深度神經網絡DNN模型的壓縮方法、裝置、設備及介質。
背景技術
深度神經網絡(Deep Neural Network,DNN)算法,是近幾年在工業界和學術界新型的一個機器學習領域的流行話題。DNN算法成功地將識別率提高了一個顯著的檔次。
與傳統的GMM(Gaussian Mixture Model,高斯混合模型)算法相比,基于DNN算法的語音識別的性能有大幅度的提升,因此,現在語音識別基本上都采用DNN算法。但是,DNN算法的計算量非常大,一般采用專門的GPU(Graphics Processing Unit,圖形處理器)才能滿足運行需求。
目前,采用主流的深度學習框架(如Kaldi,TensorFlow等)對DNN聲學模型進行訓練,DNN聲學模型默認所有參數都是浮點型數據。DNN算法的計算量本來就比較大,而模型的參數又全是浮點型數據,加上浮點型數據的乘法運算的速度較慢,會使得DNN算法的計算速度進一步變慢。同時,浮點型數據的DNN模型占用內存也比較大。因此,無法在普通的CPU(Central Processing Unit,中央處理器)上運行上述DNN模型。
發明內容
本發明實施例提供了一種深度神經網絡DNN模型的壓縮方法、裝置、設備及介質,以實現對DNN模型的壓縮,使其可以在普通的CPU上運行,提高DNN模型的計算速度。
第一方面,本發明實施例提供了一種深度神經網絡DNN模型的壓縮方法,包括:
獲取待壓縮DNN模型,其中,所述待壓縮DNN模型包括:輸入層、至少一個隱藏層以及輸出層,所述待壓縮DNN模型中各層的層參數為浮點型數據;
對所述待壓縮DNN模型中各層的層參數進行定點化處理,以實現對所述DNN模型的壓縮。
第二方面,本發明實施例還提供了一種深度神經網絡DNN模型的壓縮裝置,該裝置包括:
獲取模塊,用于獲取待壓縮DNN模型,其中,所述待壓縮DNN模型包括:輸入層、至少一個隱藏層以及輸出層,所述待壓縮DNN模型中各層的層參數為浮點型數據;
壓縮模塊,用于對所述待壓縮DNN模型中各層的層參數進行定點化處理,以實現對所述DNN模型的壓縮。
第三方面,本發明實施例還提供了一種計算機設備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,所述處理器執行所述程序時實現本發明任意實施例所述的深度神經網絡DNN模型的壓縮方法。
第四方面,本發明實施例還提供了一種計算機可讀存儲介質,其上存儲有計算機程序,該程序被處理器執行時實現本發明任意實施例所述的深度神經網絡DNN模型的壓縮方法。
本發明實施例提供的一種深度神經網絡DNN模型的壓縮方法、裝置、設備及介質,通過獲取各層的層參數均為浮點型數據的待壓縮DNN模型;對所述待壓縮DNN模型中各層的層參數進行定點化處理,以實現對所述DNN模型的壓縮的技術方案,基于現有技術中DNN模型無法在普通CPU上運行的問題,提出了有效的解決方案,同時減小了DNN模型的占用內存,提高了DNN模型的計算速度。
附圖說明
圖1是本發明實施例一提供的一種深度神經網絡DNN模型的壓縮方法的流程圖;
圖2是本發明實施例二提供的一種深度神經網絡DNN模型的壓縮裝置的結構示意圖;
圖3是本發明實施例三中的一種計算機設備的硬件結構示意圖。
具體實施方式
下面結合附圖和實施例對本發明作進一步的詳細說明。可以理解的是,此處所描述的具體實施例僅僅用于解釋本發明,而非對本發明的限定。另外還需要說明的是,為了便于描述,附圖中僅示出了與本發明相關的部分而非全部結構。
另外還需要說明的是,為了便于描述,附圖中僅示出了與本發明相關的部分而非全部內容。在更加詳細地討論示例性實施例之前應當提到的是,一些示例性實施例被描述成作為流程圖描繪的處理或方法。雖然流程圖將各項操作(或步驟)描述成順序的處理,但是其中的許多操作可以被并行地、并發地或者同時實施。此外,各項操作的順序可以被重新安排。當其操作完成時所述處理可以被終止,但是還可以具有未包括在附圖中的附加步驟。所述處理可以對應于方法、函數、規程、子例程、子程序等等。
實施例一
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京智能管家科技有限公司,未經北京智能管家科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711064586.8/2.html,轉載請聲明來源鉆瓜專利網。





