[發明專利]caffemodel模型壓縮方法、系統、設備及介質在審
| 申請號: | 201810836366.0 | 申請日: | 2018-07-26 |
| 公開(公告)號: | CN109086819A | 公開(公告)日: | 2018-12-25 |
| 發明(設計)人: | 羅壯 | 申請(專利權)人: | 北京京東尚科信息技術有限公司;北京京東世紀貿易有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 上海弼興律師事務所 31283 | 代理人: | 薛琦;羅朗 |
| 地址: | 100195 北京市海淀區杏石口路6*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 權重矩陣 模型壓縮 掩碼矩陣 存儲空間 迭代結束 格式生成 稀疏矩陣 元素相乘 訓練集 迭代 壓縮 轉化 | ||
1.一種caffemodel模型壓縮方法,其特征在于,所述caffemodel模型壓縮方法包括:
利用caffe框架導入一訓練后的caffemodel模型,所述caffemodel模型包括fc6層和/或fc7層,所述fc6層和/或fc7層的權重矩陣為第一權重矩陣;
獲取所述第一權重矩陣;
將所述第一權重矩陣中的絕對值大于和等于預設閾值的元素設置為1,并將所述第一權重矩陣中的絕對值小于所述預設閾值的元素設置為0后,生成掩碼矩陣,所述預設閾值為一正值;
利用訓練集訓練所述caffemodel模型,迭代后,所述fc6層和/或fc7層的權重矩陣為第二權重矩陣;
將所述第二權重矩陣中的每項元素與所述掩碼矩陣中對應的每項元素相乘生成第三權重矩陣,將所述fc6層和/或fc7層的權重矩陣設置為所述第三權重矩陣;
返回所述利用訓練集訓練所述caffemodel模型,迭代后,所述fc6層和/或fc7層的權重矩陣為第二權重矩陣的步驟;
直至達到預設迭代結束條件,則迭代結束,將所述第三權重矩陣轉化為對應的csr稀疏矩陣格式生成壓縮權重矩陣,將所述caffemodel模型的權重矩陣設置為所述壓縮權重矩陣。
2.如權利要求1所述的caffemodel模型壓縮方法,其特征在于,所述將所述caffemodel模型的權重矩陣設置為所述壓縮權重矩陣的步驟還包括:
迭代結束后,獲得所述caffemodel模型的訓練精度為迭代訓練精度;
迭代前的所述caffemodel模型的訓練精度為原始訓練精度,計算所述迭代訓練精度相比所述原始訓練精度的下降比例,若所述下降比例高于預設精度比例,則降低所述預設閾值,返回生成所述掩碼矩陣的步驟;
所述將所述第三權重矩陣轉化為對應的稀疏矩陣格式生成所述壓縮權重矩陣的步驟包括:
直至所述下降比例低于所述預設精度比例,將所述第三權重矩陣轉化為對應的稀疏矩陣格式生成所述壓縮權重矩陣。
3.如權利要求2所述的caffemodel模型壓縮方法,其特征在于,所述預設精度比例的范圍為0.1%-0.0.5%。
4.如權利要求1所述的caffemodel模型壓縮方法,其特征在于,所述將所述caffemodel模型的權重矩陣設置為所述壓縮權重矩陣的步驟之后還括:
利用所述fc6層和/或fc7層接收輸入數據,并將所述輸入數據與所述壓縮權重矩陣作相乘運算得到輸出數據。
5.一種caffemodel模型壓縮系統,其特征在于,所述caffemodel模型壓縮系統包括導入模塊、掩碼生成模塊、迭代模塊、掩碼模塊、返回模塊和轉化模塊;
所述導入模塊用于利用caffe框架導入一訓練后的caffemodel模型,所述caffemodel模型包括fc6層和/或fc7層,所述fc6層和/或fc7層的權重矩陣為第一權重矩陣;
所述掩碼生成模塊用于獲取所述第一權重矩陣,并將所述第一權重矩陣中的絕對值大于和等于預設閾值的元素設置為1,并將所述第一權重矩陣中的絕對值小于所述預設閾值的元素設置為0后,生成掩碼矩陣,所述預設閾值為一正值;
所述迭代模塊用于利用訓練集訓練所述caffemodel模型,迭代后,所述fc6層和/或fc7層的權重矩陣為第二權重矩陣;
所述掩碼模塊用于將所述第二權重矩陣中的每項元素與所述掩碼矩陣中對應的每項元素相乘生成第三權重矩陣,將所述fc6層和/或fc7層的權重矩陣設置為所述第三權重矩陣;
所述返回模塊用于返回所述利用訓練集訓練所述caffemodel模型,迭代后,所述fc6層和/或fc7層的權重矩陣為第二權重矩陣的步驟;
所述轉化模塊用于直至達到預設迭代結束條件,則迭代結束,將所述第三權重矩陣轉化為對應的csr稀疏矩陣格式生成壓縮權重矩陣,將所述caffemodel模型的權重矩陣設置為所述壓縮權重矩陣。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京京東尚科信息技術有限公司;北京京東世紀貿易有限公司,未經北京京東尚科信息技術有限公司;北京京東世紀貿易有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810836366.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:海洋鋒面識別方法和裝置
- 下一篇:基于能耗數據關聯挖掘的建筑節能改造決策方法





