[發明專利]實時量化方法及實時量化系統有效
申請號: | 202110759386.4 | 申請日: | 2021-07-06 |
公開(公告)號: | CN113255901B | 公開(公告)日: | 2021-10-08 |
發明(設計)人: | 梁軍 | 申請(專利權)人: | 上海齊感電子信息科技有限公司 |
主分類號: | G06N3/04 | 分類號: | G06N3/04;G06N3/08 |
代理公司: | 上海恒銳佳知識產權代理事務所(普通合伙) 31286 | 代理人: | 黃海霞 |
地址: | 201210 上海市浦東*** | 國省代碼: | 上海;31 |
權利要求書: | 查看更多 | 說明書: | 查看更多 |
摘要: | |||
搜索關鍵詞: | 實時 量化 方法 系統 | ||
本發明提供了一種實時量化方法及用于執行所述實時量化方法的實時量化系統。所述實時量化方法包括輸入原始特征圖,依據所述原始特征圖得到數據最大值和數據最小值;依據所述數據最大值和所述數據最小值,計算初始量化因子;進行速度量化流程和優化量化流程中的任一流程,依據所述初始量化因子,依次計算量化因子對、第一特征圖和第二特征圖,直接在線上實時量化原始特征圖,避免了線下量化不能很好地量化全部的輸入數據的問題,解決了深度神經網絡計算量高的問題,提高了深度神經網絡的計算效率。通過計算量化因子對,提高了量化精度。適用性更廣,量化數據更完整,量化結果更可靠。
技術領域
本發明涉及深度神經網絡技術領域,尤其涉及一種實時量化方法及實時量化系統。
背景技術
深度神經網絡是基于學習的方法的一種,其通過逐層抽象特征 ,組合底層抽象形成高層特征抽象,來發現數據的特征,解決不同的數據表示問題。其拓撲結構和計算方式模擬人腦神經系統 ,事實證明可準確地感知數據特征。深度神經網絡包括CNN,DNN,RNN等結構。近年基于深度神經網絡的方法的目標圖像識,語音識別,大數據分析等方面別得到很好的效果。
但是深度神經網絡結構復雜,規模大,計算量高,對應用深度神經網絡的使用條件提出較高要求,這成為現在主要問題之一。
公開號為CN 112200275 A的發明專利,公開了人工神經網絡的量化方法及裝置,所述量化方法包括:根據圖像集中的部分圖像,來計算理想分布p;根據理想分布p,來從圖像集中篩選出用于對該人工神經網絡進行量化的量化圖集;采用所述量化圖集來對該人工神經網絡進行量化。該發明提高了人工神經網絡的量化精度,降低因網絡壓縮而造成的性能損失,實現篩選量化圖片的自動化,在原始數據集較大時可極大地提升圖像選擇的效率,同時也大量節省人的時間與精力。該發明采用從圖片集的部分圖像中選取一個量化因子使得最終的推理結果和原始數據推理結果的相似度最大,從而實現人工神經網絡的量化。而這一過程中并不是網絡推理過程實時進行的,而是在部署推理之前提前計算好的,提前計算好網絡每一層圖像的量化因子存在以下不足:
其一,對于不同
的輸入使用同一套量化因子進行優化,只能對多數輸入進行量化,不能很好地量化的所有的個體輸入,即有少數的輸入數據得不到很好地量化。
其二,線下量化時選取的圖片集并不能包含所有可能的輸入分布,即輸入分布中未選取的圖片集不能得到很好的量化,所以得出的量化位不能對所有可能的輸入分布都有很好的表現。
因此,有必要提供實時量化方法及實時量化系統以解決上述的現有技術中存在的問題。
發明內容
本發明的目的在于提供一種實時量化方法及實時量化系統,以解決深度神經網絡計算量高、線下量化不能很好的量化全部輸入數據的問題。
為實現上述目的,本發明的所述實時量化方法包括步驟:
S1:輸入原始特征圖,依據所述原始特征圖得到數據最大值和數據最小值;
S2:依據所述數據最大值和所述數據最小值,計算初始量化因子;
S3:進行速度量化流程和優化量化流程中的任一流程,依據所述初始量化因子,依次計算量化因子對、第一特征圖和第二特征圖。
本發明的所述實時量化方法的有益效果在于:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海齊感電子信息科技有限公司,未經上海齊感電子信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110759386.4/2.html,轉載請聲明來源鉆瓜專利網。