[發明專利]基于FPGA的卷積神經網絡架構方法及其人臉識別方法在審
| 申請號: | 201911366823.5 | 申請日: | 2019-12-26 |
| 公開(公告)號: | CN111126309A | 公開(公告)日: | 2020-05-08 |
| 發明(設計)人: | 劉文;蔣云翔;朱佳;蔡曄;丁杰;郝志杰 | 申請(專利權)人: | 長沙海格北斗信息技術有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06N3/04 |
| 代理公司: | 長沙永星專利商標事務所(普通合伙) 43001 | 代理人: | 周詠;米中業 |
| 地址: | 410000 湖南省長*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 fpga 卷積 神經網絡 架構 方法 其人 識別 | ||
本發明公開了一種基于FPGA的卷積神經網絡架構方法,包括系統初始化;根據crp的內部狀態啟動dma,讀取ps側的圖像信息;根據S3FD算法,復用crp模塊從而完成conv計算;對crp模塊內部的乘加卷積運算進行實現與調度;對結構幀控模塊進行復用;對結構層孔模塊進行復用;對crp_calc模塊進行復用本發明還公開了包括所述基于FPGA的卷積神經網絡架構方法的人臉識別方法。本發明提供的這種基于FPGA的卷積神經網絡架構方法及其人臉識別方法,采用FPGA復用的方式實現卷積神經網絡的架構,兼顧了FPGA內部資源和卷積神經網絡的運算速度;而且本發明方法的可靠性高,適用性好。
技術領域
本發明屬于圖像識別領域,具體涉及一種基于FPGA的卷積神經網絡架構方法及其人臉識別方法。
背景技術
隨著經濟技術的發展,智能網絡時代已經到來。而人臉識別技術,也已經廣泛應用于人們的生產和生活當中,給人們的生產和生活帶來了無盡的便利。
現今的人臉識別技術,往往依靠的是傳統的CNN算法,即卷積神經網絡算法。傳統的CNN算法大多基于通用處理器實現,在實時性和功耗方面都不能滿足應用的需求。就目前卷積神經網絡應用技術的發展而言,算法本身需要對圖片等數據進行卷積運算操作,致使CPU運算速度極慢,資源消耗極高;而這也是限制卷積神經網絡發展的一大重要因素。
現階段出現了各種基于FPGA的卷積神經網絡架構的設計,也確實為神經網絡的發展解決了一些難題,但是由于各種算法中CNN層數不同,乘加運算量的差異,同時也受制于FPGA內部資源及功耗,對于一些權重位寬較大、個數較多的架構,FPGA并不能滿足設計要求。這就要求對算法進行剪枝優化處理:剪枝能使算法的運算量降低,節省FPGA的邏輯消耗;但是,經過剪枝之后的算法在精度方面會降低,影響算法實現的效果。
因此,目前并沒有一種能夠兼顧性能和資源的基于FPGA的卷積神經網絡架構方法。
發明內容
本發明的目的之一在于提供一種能夠兼顧性能和資源、可靠性高且適用性好的基于FPGA的卷積神經網絡架構方法。
本發明的目的之二在于提供一種包括了所述基于FPGA的卷積神經網絡架構方法的人臉識別方法。
本發明提供的這種基于FPGA的卷積神經網絡架構方法,包括如下步驟:
S1.系統初始化;
S2.根據crp(卷積神經網絡模塊)的內部狀態啟動dma(直接存儲器訪問模塊),讀取ps(programmable system)側的圖像信息;
S3.根據S3FD算法,復用crp模塊從而完成conv計算;所述conv為卷積神經網絡運算模塊;
S4.對crp模塊內部的乘加卷積運算進行實現與調度;
S5.對結構幀控模塊進行復用;
S6.對結構層孔模塊進行復用;
S7.對crp_calc模塊進行復用;所述crp_calc模塊為卷積神經網絡的乘加運算模塊。
步驟S1所述的系統初始化,具體包括接收CPU通過APB總線下發的各項數據。
所述的各項數據包括DMA的讀寫首地址,圖像信息、卷積核信息和反量化信息。
步驟S4所述的crp模塊,具體包括crp_frame_ctrl模塊,crp_layer_ctrl模塊和crp_calc模塊;crp_frame_ctrl模塊用于負責幀控制與調度;crp_layer_ctrl模塊用于負責crp層的控制與調度,crp_calc模塊用于完成卷積神經網絡的乘加運算。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于長沙海格北斗信息技術有限公司,未經長沙海格北斗信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911366823.5/2.html,轉載請聲明來源鉆瓜專利網。





