[發明專利]caffemodel模型壓縮方法、系統、設備及介質在審
| 申請號: | 201810836366.0 | 申請日: | 2018-07-26 |
| 公開(公告)號: | CN109086819A | 公開(公告)日: | 2018-12-25 |
| 發明(設計)人: | 羅壯 | 申請(專利權)人: | 北京京東尚科信息技術有限公司;北京京東世紀貿易有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 上海弼興律師事務所 31283 | 代理人: | 薛琦;羅朗 |
| 地址: | 100195 北京市海淀區杏石口路6*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 權重矩陣 模型壓縮 掩碼矩陣 存儲空間 迭代結束 格式生成 稀疏矩陣 元素相乘 訓練集 迭代 壓縮 轉化 | ||
本發明公開了一種caffemodel模型壓縮方法、系統、設備及介質,其中caffemodel模型壓縮方法包括:利用caffe框架導入一訓練后的caffemodel模型;獲取第一權重矩陣;生成掩碼矩陣;利用訓練集訓練caffemodel模型,迭代后,fc6層和/或fc7層的權重矩陣為第二權重矩陣;將第二權重矩陣中的每項元素與掩碼矩陣中對應的每項元素相乘生成第三權重矩陣,將fc6層和/或fc7層的權重矩陣設置為第三權重矩陣;迭代結束,將第三權重矩陣轉化為對應的csr稀疏矩陣格式生成壓縮權重矩陣。本發明的方法可達到降低caffemodel模型的存儲空間的效果。
技術領域
本發明涉及算法領域,具體涉及一種caffemodel模型壓縮方法、系統、設備及介質。
背景技術
Pvanet-faster-rcnn(一種物體檢測模型)是一種基于卷積神經網絡的對圖像中物體進行檢測的算法模型。在caffe(一種深度學習框架)框架下訓練標準的Pvanet-faster-rcnn模型得到的caffemodel(深度學習框架模型)模型的尺寸是369MB(兆,計算機中的一種存儲單位),該模型由若干層構成,其中fc6(全連接層第6層)層和fc7層(全連接層第7層)的權重參數合計約占352MB。
當用GPU(圖形處理器)卡計算該模型時,369MB大小的caffemodel模型將駐留在GPU顯存中,caffemodel模型中的參數量較大,占用GPU顯存資源較多,無法在顯存資源緊張的GPU顯卡上運行,導致GPU運算性能下降。
發明內容
本發明要解決的技術問題是為了克服現有技術中caffemodel模型在運算時占用GPU顯存,導致GPU運算性能下降的缺陷,提供一種caffemodel模型壓縮方法、系統、設備及介質。
本發明是通過下述技術方案來解決上述技術問題:
一種caffemodel模型壓縮方法,所述caffemodel模型壓縮方法包括:
利用caffe框架導入一訓練后的caffemodel模型,所述caffemodel模型包括fc6層和/或fc7層,所述fc6層和/或fc7層的權重矩陣為第一權重矩陣;
獲取所述第一權重矩陣;
將所述第一權重矩陣中的絕對值大于和等于預設閾值的元素設置為1,并將所述第一權重矩陣中的絕對值小于所述預設閾值的元素設置為0后,生成掩碼矩陣,所述預設閾值為一正值;
利用訓練集訓練所述caffemodel模型,迭代后,所述fc6層和/或fc7層的權重矩陣為第二權重矩陣;
將所述第二權重矩陣中的每項元素與所述掩碼矩陣中對應的每項元素相乘生成第三權重矩陣,將所述fc6層和/或fc7層的權重矩陣設置為所述第三權重矩陣;
返回所述利用訓練集訓練所述caffemodel模型,迭代后,所述fc6層和/或fc7層的權重矩陣為第二權重矩陣的步驟;
直至達到預設迭代結束條件,則迭代結束,將所述第三權重矩陣轉化為對應的csr(一種稀疏矩陣壓縮存儲格式)稀疏矩陣格式生成壓縮權重矩陣,將所述caffemodel模型的權重矩陣設置為所述壓縮權重矩陣。
較佳地,所述將所述caffemodel模型的權重矩陣設置為所述壓縮權重矩陣的步驟還包括:
迭代結束后,獲得所述caffemodel模型的訓練精度為迭代訓練精度;
迭代前的所述caffemodel模型的訓練精度為原始訓練精度,計算所述迭代訓練精度相比所述原始訓練精度的下降比例,若所述下降比例高于預設精度比例,則降低所述預設閾值,返回生成所述掩碼矩陣的步驟;
所述將所述第三權重矩陣轉化為對應的稀疏矩陣格式生成所述壓縮權重矩陣的步驟包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京京東尚科信息技術有限公司;北京京東世紀貿易有限公司,未經北京京東尚科信息技術有限公司;北京京東世紀貿易有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810836366.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:海洋鋒面識別方法和裝置
- 下一篇:基于能耗數據關聯挖掘的建筑節能改造決策方法





