[發明專利]一種神經網絡壓縮方法及其相關設備在審
| 申請號: | 202110221937.1 | 申請日: | 2021-02-27 |
| 公開(公告)號: | CN113065638A | 公開(公告)日: | 2021-07-02 |
| 發明(設計)人: | 聶迎;韓凱;劉振華;王云鶴;許春景 | 申請(專利權)人: | 華為技術有限公司 |
| 主分類號: | G06N3/04 | 分類號: | G06N3/04;G06N3/08 |
| 代理公司: | 深圳市深佳知識產權代理事務所(普通合伙) 44285 | 代理人: | 王仲凱 |
| 地址: | 518129 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 神經網絡 壓縮 方法 及其 相關 設備 | ||
本申請提供一種神經網絡壓縮方法及其相關設備,可使得壓縮后的神經網絡對不同圖像進行不同精度的圖像處理,從而保證圖像處理的準確性。本申請的方法包括:獲取目標圖像;將目標圖像輸入第一神經網絡,得到第二神經網絡的量化比特數,其中,第二神經網絡用于對目標圖像進行圖像處理,第二神經網絡的量化比特數與圖像處理所需的計算量正相關;根據第二神經網絡的量化比特數,對第二神經網絡的參數進行量化處理,得到量化處理后的第二神經網絡。
技術領域
本申請涉及人工智能技術領域,尤其涉及一種神經網絡壓縮方法及其相關設備。
背景技術
近幾年來,深度神經網絡在諸如圖像分類、目標檢測和圖像分割等計算機視覺任務上取得了很大的進展。但深度神經網絡往往包含大量的模型參數,需占用較大的設備資源(如存儲空間和計算量等),難以在終端設備上高效運行。因此,需要對神經網絡進行壓縮,從而降低神經網絡占用的設備資源。
模型量化技術是壓縮神經網絡的有效方法,該技術可將神經網絡的參數從高比特數(例如,32比特)的值轉換為低比特數(例如,4比特)的值進行表示,從而明顯降低神經網絡的參數所占用的資源。
在進行模型量化時,量化比特數(即用戶所期望的,神經網絡的參數的比特數)通常是預置且固定的,導致神經網絡在進行圖像處理時,對任何圖像的處理精度都是一致的,無法保證圖像處理的準確性(例如,若某個圖像的處理難度較大,神經網絡對其的處理精度較低時,會導致處理結果不夠準確)。
發明內容
本申請實施例提供了一種神經網絡壓縮方法及其相關設備,可使得壓縮后的神經網絡對不同圖像進行不同精度的圖像處理,從而保證圖像處理的準確性。
本申請實施例的第一方面提供了一種神經網絡壓縮方法,該方法包括:
當需要對目標圖像進行圖像處理時,可先獲取待處理的目標圖像。進一步地,還可獲取第一神經網絡和第二神經網絡,其中,第一神經網絡用于壓縮第二神經網絡,第二神經網絡用于對目標圖像進行圖像處理。
然后,將目標圖像輸入第一神經網絡,得到第二神經網絡的量化比特數,其中,第二神經網絡的量化比特數與圖像處理所需的計算量正相關。例如,若目標圖像中的物體比較容易識別,對目標圖像進行識別時所需的計算量較少,即第二神經網絡對目標圖像的處理精度可較低,故第二神經網絡的量化比特數則較小。若目標圖像中的物體比較難識別,對目標圖像進行識別時所需的計算量較多,即第二神經網絡對目標圖像的處理精度需較高,故第二神經網絡的量化比特數則較大。
最后,根據第二神經網絡的量化比特數,對第二神經網絡的參數進行量化處理,得到量化處理后的第二神經網絡,即壓縮后的第二神經網絡。例如,當第二神經網絡的量化比特數為4比特時,則將第二神經網絡的參數以4比特的數值進行表示,從而降低第二神經網絡所占用的設備資源。
從上述方法可以看出:在獲取目標圖像后,可將目標圖像輸入第一神經網絡,以得到用于壓縮第二神經網絡的量化比特數。該量化比特數與對目標圖像進行圖像處理所需的計算量正相關,若對目標圖像進行圖像處理所需的計算量較多,則該量化比特數較大,若對目標圖像進行圖像處理所需的計算量較少,則該量化比特數較小。可見,由于目標圖像的處理難度不同,第一神經網絡輸出的量化比特數則不同,使得對第二神經網絡的量化處理程度也不同。如此一來,對于處理難度較小的目標圖像,量化處理后的第二神經網絡可對其進行精度較小的圖像處理,對于處理難度較大的目標圖像,量化處理后的第二神經網絡可對其進行精度較大的圖像處理,從而保證圖像處理的準確性。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華為技術有限公司,未經華為技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110221937.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種感知網絡及數據處理方法
- 下一篇:一種手勢識別方法以及相關裝置





