[發明專利]一種神經網絡芯片有效
| 申請號: | 201710890838.6 | 申請日: | 2017-09-27 |
| 公開(公告)號: | CN108205704B | 公開(公告)日: | 2021-10-29 |
| 發明(設計)人: | 李清正;毛寧元;劉文志 | 申請(專利權)人: | 深圳市商湯科技有限公司 |
| 主分類號: | G06N3/063 | 分類號: | G06N3/063 |
| 代理公司: | 深圳中一專利商標事務所 44237 | 代理人: | 姚澤鑫 |
| 地址: | 518000 廣東省深圳市*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 神經網絡 芯片 | ||
本發明提供一種神經網絡芯片,用于高新的實現卷積神經網絡運算。包括:深度學習運算模塊,數據采集模塊,數據輸出模塊,數據存儲模塊,處理器;所述深度學習運算模塊用于對輸入數據進行深度學習運算,所述深度學習運算包括并行的乘法運算以及加法樹的累積運行;所述數據采集模塊用于對輸入數據進行數據采集;所述數據輸出模塊用于輸出所述神經網絡芯片運算的運算結果。所述處理器用于調度所述深度學習運算模塊,所述數據采集模塊和數據輸出模塊間的數據交互,并處理非深度學習的運算。
技術領域
本發明涉及硬件芯片技術領域,具體涉及一種神經網絡芯片。
背景技術
深度學習是近年來人工智能領域的一個熱點分支,經過模擬人腦的神經元處理機制,來分析和解釋數據信息,例如:圖像,聲音,文本。
深度學習的提出使得人工神經網絡重新成為機器學習領域的重要研究方向,卷積神經網絡(CNN,Convolutional Neural Network)算法近年來廣泛應用于圖像處理,模式識別等領域,它具有結構簡單,適應性強,魯棒性高等特點。
卷積神經網絡由大量的節點(或稱“神經元”,或“單元”)和之間相互聯接構成。每個節點代表一種特定的輸出函數,稱為激勵函數(activation function)。每兩個節點間的連接都代表一個對于通過該連接信號的加權值,稱之為權重(weight),這相當于卷積神經網絡的記憶。由于卷積神經網絡的復雜性,因此卷積神經網絡的數據運算是業界的一個難題。
現有的卷積神經網絡有以下兩種芯片架構實現方式:
1、基于圖像處理器(GPU,Graphics Processing Unit)架構的設計,芯片架構如圖1所示。
2、基于現場可編程陣列(FPGA,Field-Programmable Gate Array)架構的設計,芯片架構如圖2所示。
無論GPU架構,還是FPGA架構,在運行深度學習計算時,由于需要用通用的計算模塊去處理深度學習的不同運算邏輯,由于通用性導致很多運算邏輯不能高效的完成。
發明內容
本發明提供一種神經網絡芯片,用于高新的實現深度神經網絡運算。
本發明提供的神經網絡芯片包括:
深度學習運算模塊101,數據采集模塊102,數據輸出模塊103,數據存儲模塊104,處理器105;
所述深度學習運算模塊101用于對輸入數據進行深度學習運算;所述深度學習運算包括并行的乘法運算以及加法樹的累積運行。
所述數據采集模塊102用于對輸入數據進行數據采集;所述數據輸出模塊103用于輸出所述神經網絡芯片運算的運算結果;
所述處理器105用于調度調度所述深度學習運算模塊,所述數據采集模塊和數據輸出模塊間的數據交互,并處理非深度學習的運算;;
所述數據存儲模塊104分別與所述深度學習運算模塊101,所述數據采集模塊102和數據輸出模塊103相連接。
可選的,所述數據存儲模塊104包括:片外存儲器1041,存儲器控制器1042;
所述存儲器控制器1042分別與所述深度學習運算模塊101,所述數據采集模塊102和數據輸出模塊103相連接;
所述存儲器控制器1042與片外存儲器1041相連接,所述存儲器控制器1042用于控制所述片外存儲器1041的數據讀寫。
可選的,所述深度學習運算模塊101包括:卷積運算單元1011,池化運算單元1012,全連接運算單元1013和計算調度單元1014;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳市商湯科技有限公司,未經深圳市商湯科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710890838.6/2.html,轉載請聲明來源鉆瓜專利網。





