[發明專利]一種使用子內核搜索模塊優化設備上神經網絡模型的方法和裝置在審
| 申請號: | 202180022464.0 | 申請日: | 2021-01-21 |
| 公開(公告)號: | CN115298671A | 公開(公告)日: | 2022-11-04 |
| 發明(設計)人: | 權成顏;金镕重;康鳳男;諸泓模 | 申請(專利權)人: | 斯特拉德視覺公司 |
| 主分類號: | G06N3/08 | 分類號: | G06N3/08;G06N3/04 |
| 代理公司: | 北京同立鈞成知識產權代理有限公司 11205 | 代理人: | 延美花;臧建明 |
| 地址: | 韓國慶*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 使用 內核 搜索 模塊 優化 設備 神經網絡 模型 方法 裝置 | ||
公開一種使用子內核搜索模塊優化設備上神經網絡模型的方法,其包括:學習裝置(a)將具有能夠使用安裝有神經網絡模型的邊緣設備允許的最大計算能力執行目標任務的最大容量的大神經網絡模型訓練成針對輸入的輸入數據生成第1推理結果的狀態下,使子內核搜索模塊通過識別與學習數據對應的約束和狀態向量來獲得適合對所述學習數據執行目標任務的特定子內核的架構信息;(b)參考所述特定子內核的所述架構信息優化所述大神經網絡模型,生成用于針對所述學習數據生成第2推理結果的特定小神經網絡模型;以及(c)參考所述第1推理結果和所述第2推理結果訓練所述子內核搜索模塊。
技術領域
本發明涉及一種設備上神經網絡模型(on-device neural network model)的優化方法和裝置,更具體地涉及一種使用子內核搜索模塊(Sub-Kernel Searching Module,SSM)優化設備上神經網絡模型的方法以及使用其的學習裝置和優化裝置,其訓練用于優化設備上神經網絡模型的子內核搜索模塊。
背景技術
由于各種因素,例如所輸入的圖像的亮度、抖動和噪聲等,使用圖像分類(Imageclassification)的設備可以難以識別所輸入的圖像的至少一部分。
因此,可以通過應用深度學習(deep learning)對各種圖像進行持續學習來提高圖像分類的準確度。
然而,為了提高圖像分類的準確度,需要對神經網絡模型(neural networkmodel)進行持續的優化(optimization),相應地,已經開發出各種用于有效更新神經網絡模型的技術。
為此,在現有技術中,人們直接設計深度學習網絡模型,但最近正在開發諸如神經架構搜索(Neural Architect Search,NAS)之類的方法,該方法通過人工智能神經網絡直接設計應用于設備的神經網絡模型。
作為一例,參見圖1,現有的NAS通過使用循環神經網絡(Recurrent NeuralNetwork,RNN)生成包括應用或將應用在設備上的神經網絡模型的架構信息的配置字符串(configuration string)來設計子神經網絡模型(child neural network model)。然后,使用驗證集(validation set)測量子神經網絡模型的性能,并作為結果獲得的準確度(accuracy)R用作強化學習(reinforcement learning)的獎勵(reward),以更新子神經網絡模型的參數(parameter)。此外,還正在應用梯度下降優化(gradient descentoptimization)和進化搜索(evolutionary search)等技術來實現最佳網絡性能。
并且,參考圖2,作為另一種現有的神經網絡優化技術,有諸如在線學習(onlinelearning)之類的方法。在這些在線學習中,在對現有的神經網絡模型進行在線推理(inference)后,根據其結果使用對現有的神經網絡模型進行更新或重新學習的過程。
如此,使用神經網絡優化神經網絡模型架構對如自動駕駛車輛、無人飛行器和機器人等的需要深度學習技術的行駛裝置中安裝的邊緣設備(edge device)很有用,使用在邊緣設備上執行特定功能的神經網絡模型的現有方法具有以下問題。
首先,安裝在邊緣設備上的神經網絡模型的模型容量(model capacity)有限,因為允許的運算量和參數數量都比較少。
并且,檢測和識別圖像所需的模型容量因多個圖像的難度而異,但安裝在邊緣設備上的現有的神經網絡模型對所有圖像應用相同的運算量和參數,從而檢測和識別能力的偏差隨著多個像的難度而增加。
另外,由于安裝在邊緣設備上的神經網絡模型在沒有人工干預的情況下很難找到難樣本(hard sample),因此通過學習難樣本來提高神經網絡模型的性能需要大量的人力和成本。
因此,需要一種能夠解決所述問題的改進方案。
發明內容
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于斯特拉德視覺公司,未經斯特拉德視覺公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202180022464.0/2.html,轉載請聲明來源鉆瓜專利網。





