[發明專利]一種數據處理方法、設備及存儲介質在審
| 申請號: | 202110240689.5 | 申請日: | 2021-03-04 |
| 公開(公告)號: | CN113112014A | 公開(公告)日: | 2021-07-13 |
| 發明(設計)人: | 李遠輝;舒紅喬 | 申請(專利權)人: | 聯想(北京)有限公司 |
| 主分類號: | G06N3/08 | 分類號: | G06N3/08;G06N3/04 |
| 代理公司: | 北京派特恩知識產權代理有限公司 11270 | 代理人: | 馬麗;張穎玲 |
| 地址: | 100085 北京市海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 數據處理 方法 設備 存儲 介質 | ||
本申請實施例公開了一種數據處理方法,該方法包括:確定待裁剪神經網絡模型中目標層的目標參數對應的至少一個第一參數值;確定壓縮比率和稀疏化率;基于壓縮比率、稀疏化率和所述至少一個第一參數值,對所述待裁剪神經網絡模型進行稀疏化裁剪處理,得到目標神經網絡模型;基于所述目標神經網絡模型對待裁剪數據進行稀疏化裁剪處理。本申請實施例還公開了一種電子設備和存儲介質。
技術領域
本申請涉及智能技術領域,尤其涉及一種數據處理方法、設備及存儲介質。
背景技術
隨著人工智能應用的迅速發展,深度學習得到了廣泛的研究。由于通過深度學習得到的神經網絡模型越來越復雜,造成需要大量的存儲空間,并消耗大量的計算資源,導致很難落實到各個硬件平臺。為了保證得到的神經網絡模型能夠落實到各個硬件平臺,提出了對得到的神經網絡模型進行裁剪壓縮的方法。進行模型裁剪壓縮的方法具體為對神經網絡模型中的所有權重系數進行稀疏化操作,得到裁剪后的模型得到實際測試效果,并將實際測試效果進行反饋,如此重復進行稀疏化訓練,最終得到壓縮后的能夠符合要求的神經網絡模型。
但是,上述模型裁剪壓縮方法的整個裁剪壓縮過程比較耗時,導致不能快速得到精度和壓縮比均相對較優的裁剪壓縮后的神經網絡模型,使裁剪壓縮效率較低。
申請內容
為解決上述技術問題,本申請實施例期望提供一種數據處理方法、設備及存儲介質,解決了目前模型裁剪壓縮過程中裁剪壓縮過程比較耗時的問題,實現了快速得到裁剪精度較優的裁剪壓縮模型的技術方案,有效提高了模型裁剪效率。
本申請的技術方案是這樣實現的:
第一方面,一種數據處理方法,所述方法包括:
確定待裁剪神經網絡模型中目標層的目標參數對應的至少一個第一參數值;
確定壓縮比率和稀疏化率;
基于壓縮比率、稀疏化率和所述至少一個第一參數值,對所述待裁剪神經網絡模型進行稀疏化裁剪處理,得到目標神經網絡模型;
基于所述目標神經網絡模型對待裁剪數據進行稀疏化裁剪處理。
可選的,所述基于壓縮比率、稀疏化率和所述至少一個第一參數值,對所述待裁剪神經網絡模型進行稀疏化裁剪處理,得到目標神經網絡模型,包括:
基于所述壓縮比率,對所述至少一個第一參數值進行分組處理,得到至少一個第一待分析參數值和至少一個第二待分析參數值;其中,每一所述第一待分析參數值小于每一所述第二待分析參數值;
基于所述稀疏化率,分別對所述至少一個第一待分析參數值和所述至少一個第二待分析參數值進行調整,依次得到至少一個第一目標參數值和至少一個第二目標參數值;
采用每一所述第一目標參數值替換所述待裁剪神經網絡模型中對應的所述第一待分析參數值,每一所述第二目標參數值替換所述待裁剪神經網絡模型中對應的所述第二待分析參數值,得到所述目標神經網絡模型。
可選的,所述基于所述壓縮比率,對所述至少一個第一參數值進行分組處理,得到至少一個第一待分析參數值和至少一個第二待分析參數值,包括:
確定第一壓縮參考比率和預設步進值;其中,所述第一壓縮參考比率與所述壓縮比率具有關聯關系,所述第一壓縮參考比率小于或等于所述壓縮比率;
基于所述第一壓縮參考比率,對所述至少一個第一參數值進行分組處理,得到至少一個第三待分析參數值和至少一個第四待分析參數值;
基于所述稀疏化率,分別對所述至少一個第三待分析參數值和所述至少一個第四待分析參數值進行調整,依次得到至少一個第一參考參數值和至少一個第二參考參數值;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于聯想(北京)有限公司,未經聯想(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110240689.5/2.html,轉載請聲明來源鉆瓜專利網。





