[發明專利]一種浮點模型的量化方法、裝置及存儲介質在審
| 申請號: | 202010945870.1 | 申請日: | 2020-09-08 |
| 公開(公告)號: | CN112070214A | 公開(公告)日: | 2020-12-11 |
| 發明(設計)人: | 李濱 | 申請(專利權)人: | 北京小米松果電子有限公司 |
| 主分類號: | G06N3/04 | 分類號: | G06N3/04;G06N3/08 |
| 代理公司: | 北京名華博信知識產權代理有限公司 11453 | 代理人: | 白瑩 |
| 地址: | 100085 北京市海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 浮點 模型 量化 方法 裝置 存儲 介質 | ||
本公開提供了一種浮點模型的量化方法、裝置及存儲介質,此方法包括:對第一浮點模型進行量化訓練,獲得包括第一量化參數集合的第二浮點模型;從第二浮點模型中提取第一量化參數集合;使用樣本數據運行第二浮點模型,統計運行過程中第二浮點模型中的第二量化參數集合;對第二浮點模型的每個處理層進行量化處理,對于每個處理層,在第一量化參數集合包括所述處理層對應的層級量化參數組時,使用第一量化參數集合中所述處理層對應的層級量化參數組進行量化處理,在第一量化參數集合不包括所述處理層對應的層級量化參數組時,使用第二量化參數集合中所述處理層對應的層級量化參數組對所述處理層進行量化處理。本公開可提高量化準確度。
技術領域
本公開涉及移動終端數據處理技術領域,尤其涉及一種浮點模型的量化方法、裝置及存儲介質。
背景技術
常用的針對浮點模型的量化一般有兩種方式,第一種是量化訓練(Quantizationaware training),第二種是訓練后量化(Post-training quantization)。其中的浮點模型可以是神經網絡模型。
對于第一種的量化訓練方式,在量化訓練時模擬運行時的量化過程,將量化參數作為訓練參數,并以量化結果作為評價指標來計算損失,可以獲得接近浮點的量化效果。維護模型所支持的算子時采用白名單的方式,對于模型中不支持的算子,則沒有相應的量化參數。
對于第二種的訓練后量化方式,訓練后量化是采用已經訓練好的浮點模型,通過輸入樣本并運行后統計模型的量化參數,此種方式中,選擇量化參數的方式較為簡單,與最優參數有一定差距,一般來說通過此種方式獲得的量化參數的精度低于上述量化訓練方式中獲得的量化參數的精度。
從而,第一種的量化訓練方式存在不支持算子從而導致模型不能部署的問題,第二種的訓練后量化方式存在精度差的問題。
發明內容
為克服相關技術中存在的問題,本公開提供了一種浮點模型的量化方法、裝置及存儲介質。
根據本公開實施例的第一方面,提供一種浮點模型的量化方法,此方法包括:
使用深度學習框架對第一浮點模型進行量化訓練,獲得包括第一量化參數集合的第二浮點模型;所述第一浮點模型包含的處理層的個數與所述第二浮點模型包含的處理層的個數相同;
從所述第二浮點模型中提取第一量化參數集合;并且,使用樣本數據運行所述第二浮點模型,統計運行過程中所述第二浮點模型中的第二量化參數集合,所述第一量化參數集合和所述第二量化參數集合均包括各處理層對應的層級量化參數組;
對所述第二浮點模型的每個處理層進行量化處理,對于每個處理層,在所述第一量化參數集合包括所述處理層對應的層級量化參數組時,使用所述第一量化參數集合中所述處理層對應的層級量化參數組進行量化處理,在所述第一量化參數集合不包括所述處理層對應的層級量化參數組時,使用所述第二量化參數集合中所述處理層對應的層級量化參數組對所述處理層進行量化處理。
在一實施方式中,所述方法還包括選擇所述樣本數據;
所述選擇樣本數據,包括:確定所述第一浮點模型的至少一應用場景,選擇覆蓋所述至少一應用場景的多種類別的樣本數據。
在一實施方式中,所述使用所述第二量化參數集合中所述處理層對應的層級量化參數組進行量化處理,包括:
根據所述第二量化參數集合確定多個第三量化參數集合,每個第三量化參數集合中的每個層級量化參數組對應的參數取值范圍小于所述第二量化參數集合中相應處理層的層級量化參數組對應的參數取值范圍,使用所述多個第三量化參數分別測試所述第二浮點模型的準確率,選擇最高的準確率所對應的第三量化參數集合;
使用選擇出的第三量化參數集合中所述處理層對應的層級量化參數組,對所述處理層進行量化處理。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京小米松果電子有限公司,未經北京小米松果電子有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010945870.1/2.html,轉載請聲明來源鉆瓜專利網。





