[發明專利]一種基于卷積神經網絡的參數填充方法與裝置有效
| 申請號: | 201910974233.4 | 申請日: | 2019-10-14 |
| 公開(公告)號: | CN110472700B | 公開(公告)日: | 2020-06-16 |
| 發明(設計)人: | 陳海波 | 申請(專利權)人: | 深蘭人工智能芯片研究院(江蘇)有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/04 |
| 代理公司: | 北京同達信恒知識產權代理有限公司 11291 | 代理人: | 李迪 |
| 地址: | 213161 江蘇省常州市武進*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 卷積 神經網絡 參數 填充 方法 裝置 | ||
本申請提供一種基于卷積神經網絡的參數填充方法與裝置。該方法可以靈活的調整卷積神經網絡的參數,同時對不同參數下確定的卷積神經網絡的權重的形狀和偏置項的形狀進行填充,使得基于填充后的權重和偏置項對輸入圖像卷積處理得到的特征圖形狀與官方原配置得到的特征圖形狀一樣,適用于按原配置設計的FPGA,無需重新設計FPGA、節省資源;且填充后權重和偏置項得到的特征圖經過后續處理得到的最終預測結果與未填充前得到特征圖經過后續處理得到的最終預測結果相同。
技術領域
本申請涉及現場可編程門陣列FPGA實現卷積神經網絡領域,尤其涉及一種基于卷積神經網絡的參數填充方法與裝置。
背景技術
隨著人工智能的不斷發展,人工智能在機器視覺、語音識別以及自然語言處理等領域都取得了重大突破。卷積神經網絡(Convolutional Neural Network,CNN)在人工智能領域受到越來越多的青睞,它是深度學習技術中極具代表性的學習算法之一,它利用空間關系,采用權值共享網絡結構,使之更類似于生物神經網絡,降低了網絡模型的復雜度并減少了權值的數量,提高了一般算法的訓練性能。卷積神經網絡的這些優點使得它成為當前語音分析和圖像識別領域的研究熱點。
隨著網絡變得越來越大、越來越復雜,我們需要大量的計算資源來對其進行訓練,因此人們紛紛將注意力轉向現場可編程門陣列(Field Programmable Gate Array,FPGA)器件,FPGA不僅具有軟件的可編程性和靈活性,同時又有專用集成電路(ApplicationSpecific Integrated Circuit,ASIC)高吞吐和低延遲的特性,而且由于具有豐富的I/O接口,FPGA還非常適合用作CNN硬件加速器。CNN硬件加速器提供更多更先進的特性,比如圖像分類、物體識別和追蹤、人臉和語音識別、自然語言處理等,將先進的人工智能網絡應用到自動化生產、控制等場景中,提高相關行業的生產力為用戶帶來更好的服務。
現有技術中,FPGA往往是依據某一神經網絡的固定網絡結構(參數結構),也就是網絡的固定配置,實現該網絡對圖像或視頻流進行物體檢測或目標識別等。一旦按照實際應用調整該卷積神經網絡的相關配置參數重新訓練,得到稍異于原結構(一般指官方網絡結構)的新結構時,那么這套按照該固定配置實現的FPGA將無法重復利用,需要重新設計。FPGA內部算法、計算單元、主控調度單元需要大量改動,耗費大量資源。
發明內容
本申請提出一種基于卷積神經網絡的參數填充方法,該方法可以靈活的調整卷積神經網絡的參數,通過分析不同于原結構的特征圖,對不同于原結構(一般指官方網絡結構)的參數進行填充,使其形狀和原結構的形狀相同,進而生成和原結構形狀相同的特征圖,并且不改變自身的后續效果,可以直接用于按原網絡結構設計好FPGA,無需重新設計、節省資源。
第一方面,本申請提供一種基于卷積神經網絡的參數填充方法,該方法包括:
確定第一參數和第二參數,所述第一參數和所述第二參數用于確定第一卷積神經網絡的第一權重的形狀和第一偏置項的形狀,當輸入圖像輸入到所述第一卷積神經網絡時,所述第一權重和所述第一偏置項用于對所述輸入圖像進行卷積生成與所述輸入圖像對應的第一特征圖;
確定改變后第一參數和/或第二參數的取值,基于改變后的第一參數和第二參數,確定第二卷積神經網絡的第二權重的形狀和第二偏置項的形狀,所述第二權重和所述第二偏置項用于對所述輸入圖像進行卷積生成與所述輸入圖像對應的第二特征圖;分析所述第二特征圖的形狀與所述第一特征圖的形狀,確定第二特征圖的需重建形狀;
根據所述需重建形狀,對所述第二權重和所述第二偏置項填充特定形狀的特定值,以使當所述輸入圖像輸入所述第二卷積神經網絡時,填充后的所述第二權重和所述第二偏置項對所述輸入圖像進行卷積得到第三特征圖,所述第三特征圖與所述第一特征圖的形狀相同,且所述第三特征圖經過后續處理得到的最終預測結果與所述第二特征圖經過所述后續處理得到的最終預測結果相同。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深蘭人工智能芯片研究院(江蘇)有限公司,未經深蘭人工智能芯片研究院(江蘇)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910974233.4/2.html,轉載請聲明來源鉆瓜專利網。





