[發明專利]基于用于深度神經網絡的增強學習的張量分解中的排序選擇在審
| 申請號: | 201980061133.0 | 申請日: | 2019-11-26 |
| 公開(公告)號: | CN113179660A | 公開(公告)日: | 2021-07-27 |
| 發明(設計)人: | 程治宇;李寶普;范彥文;包英澤 | 申請(專利權)人: | 百度時代網絡技術(北京)有限公司;百度(美國)有限責任公司 |
| 主分類號: | G06N3/04 | 分類號: | G06N3/04 |
| 代理公司: | 北京英賽嘉華知識產權代理有限責任公司 11204 | 代理人: | 王達佐;王艷春 |
| 地址: | 100080 北京市海淀區東*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 用于 深度 神經網絡 增強 學習 張量 分解 中的 排序 選擇 | ||
張量分解對于壓縮深度神經網絡(DNN)有利。在DNN的許多應用中,減少參數的數量和計算工作量有助于提高部署中的推理速度。現代DNN包括具有多陣列權重的多個層,其中張量分解是執行壓縮的自然方式,其中卷積層或完全連接層中的權重張量用指定的張量排序(例如,標準排序、張量列排序)來分解。使用DNN的常規張量分解涉及手動選擇排序,這需要繁瑣的人工來優化性能。因此,本文提出了排序選擇實施方式,其受增強學習的啟發,以自動選擇張量分解中的排序。實驗結果驗證了基于學習的排序選擇實施方式顯著地優于對多個測試數據集的手工制作的排序選擇試探法,目的是有效地壓縮深度神經網絡,同時保持相當的精度。
技術領域
本公開大體上涉及用于計算機學習的系統和方法,其可提供改進的計算機性能、特征和使用。更具體地,本公開涉及用于改進深度學習模型的系統和方法。
背景技術
深度神經網絡在諸如計算機視覺、自然語言處理、推薦系統等領域取得了巨大的成功。隨著機器學習模型的能力增長,其潛在用途也擴展了。新的應用領域每天都在擴大。
然而,機器學習模型經常需要大量資源,諸如存儲器、計算資源和功率。這種高資源需求限制了機器學習技術的使用,因為遺憾的是,在許多情況下,只有資源受限的設備可用。例如,移動電話、嵌入式設備和物聯網(IoT)設備非常流行,但是它們通常具有有限的計算和功率資源。
如果模型大小可減小,則其相應的資源要求通常也將減小。但是,減小模型大小并不是一個很小的任務。確定如何減小模型大小很復雜。另外,可減小模型的尺寸,但是隨后可能嚴重影響其性能。
因此,所需要的是用于在不顯著影響模型性能的情況下減少模型的資源需求的新方法。
發明內容
根據第一方面,本公開的一些實施方式提供了一種計算機實現的方法,用于選擇對預訓練的深度神經網絡(DNN)的一個或多個層的權重張量進行分解的排序,所述方法包括:將與所述預訓練的DNN的一個或多個層相關的元素嵌入到狀態空間中;對于要分解其權重張量的經過預訓練的DNN的每一層,初始化具有預置值的動作;迭代,直到達到停止條件,一組步驟包括:對于要分解其權重張量的經過預訓練的DNN的每一層,使代理使用嵌入元素的至少部分和來自先前迭代的獎勵值,如可用,以確定與該層的排序相關的動作值;響應于要分解其權重張量的預訓練DNN的每一層具有動作值:對于要分解其權重張量的預訓練DNN的每一層,根據從其動作值確定的其排序來分解其權重張量;利用具有分解后的權重張量的預訓練后的DNN對目標數據集執行推理以獲得獎勵度量,該獎勵度量基于推理精度和由于分解后的權重張量的模型壓縮;以及響應于已達到的停止條件,輸出預訓練的DNN的每一層的對應于最佳獎勵度量的排序,所述預訓練的DNN的每一層的權重張量均已進行分解。
根據第二方面,本公開的一些實施方式提供了一種包括一個或多個指令序列的非暫時性計算機可讀介質,所述指令序列在由至少一個處理器執行時引起執行用于選擇對預訓練的深度神經網絡(DNN)的一個或多個層的權重張量進行分解的排序的步驟,所述步驟包括:對于要分解其權重張量的經過預訓練的DNN的每一層,使代理使用嵌入元素的至少部分和來自先前迭代的獎勵值,如可用,以確定與該層的排序相關的動作值;響應于要分解其權重張量的預訓練DNN的每一層具有動作值:對于要分解其權重張量的預訓練DNN的每一層,根據從其動作值確定的其排序來分解其權重張量;利用具有分解后的權重張量的預訓練后的DNN對目標數據集執行推理以獲得獎勵度量,該獎勵度量基于推理精度和由于分解后的權重張量的模型壓縮;以及響應于已達到的停止條件,輸出預訓練的DNN的每一層的對應于最佳獎勵度量的排序,所述預訓練的DNN的每一層的權重張量均已進行分解。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于百度時代網絡技術(北京)有限公司;百度(美國)有限責任公司,未經百度時代網絡技術(北京)有限公司;百度(美國)有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201980061133.0/2.html,轉載請聲明來源鉆瓜專利網。





