[發明專利]一種計算裝置及板卡有效
| 申請號: | 201811429808.6 | 申請日: | 2018-11-27 |
| 公開(公告)號: | CN109522052B | 公開(公告)日: | 2020-05-08 |
| 發明(設計)人: | 不公告發明人 | 申請(專利權)人: | 中科寒武紀科技股份有限公司 |
| 主分類號: | G06F9/30 | 分類號: | G06F9/30;G06N3/04;G06N3/063;G06N3/08 |
| 代理公司: | 廣州三環專利商標代理有限公司 44202 | 代理人: | 郝傳鑫;熊永強 |
| 地址: | 100000 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 計算 裝置 板卡 | ||
本申請提供一種計算裝置及板卡,所述計算裝置用于執行循環神經網絡運算,所述板卡,所述板卡包括:存儲器件、接口裝置和控制器件以及神經網絡芯片,所述神經網絡芯片包括計算裝置,所述存儲器件,用于存儲數據;所述接口裝置,用于實現所述芯片與外部設備之間的數據傳輸;所述控制器件,用于對所述芯片的狀態進行監控,本申請提供的計算裝置具有成本低、功耗低的優點。
技術領域
本申請涉及信息處理技術領域,具體涉及一種計算裝置及板卡。
背景技術
隨著信息技術的不斷發展和人們日益增長的需求,人們對信息及時性的要求越來越高了。目前,終端對信息的獲取以及處理均是基于通用處理器獲得的。例如通用處理器循環神經網絡被廣泛應用于語音識別,語言建模,翻譯,圖片描述等領域,近年來由于其較高的識別準確度和較好的可并行性,受到學術界和工業界越來越廣泛的關注。
在實踐中發現,這種基于通用處理器運行軟件程序來處理循環神經網絡,但是循環神經網絡通過處理器,效率低,功耗高。
發明內容
本申請實施例提供了一種計算裝置及相關產品,可提升循環神經網絡的處理速度,提高效率、節省功耗。
第一方面,提供一種計算裝置,所述所述計算裝置用于執行循環神經網絡運算,所述循環神經網絡包括:輸入層、隱層和輸出層,輸入層、隱層和輸出層包括H個,所述計算裝置包括:運算單元以及控制器單元;所述運算單元包括:一個主處理電路和從處理電路;所述計算裝置用于執行循環神經網絡的第h個隱層計算,所述h個隱層對應的時間為t;
所述控制器單元,用于獲取第h個隱層的輸入數據Xit、第h個隱層的權值W,第h-1個隱層的輸出結果Oit-1;
所述控制器單元,還用于將輸入數據Xit、權值W以及輸出結果Oit-1發送給所述主處理電路;
所述主處理電路,用于將輸入數據Xit拆分成多個輸入數據塊,將輸出結果Oit-1拆分成多個輸出數據塊,將多個輸入數據塊以及多個輸出數據塊分發給從處理電路,將所述權值W廣播給所述從處理電路;
從處理電路,用于將接收到的輸入數據塊與權值執行乘積運算得到輸入中間結果,將接收到的輸出數據塊與權值執行乘積運算得到輸出中間結果,將輸入中間結果以及輸出中間結果發送給主處理電路;
所述主處理電路,還用于將從處理電路的輸入中間結果得到部分輸出結果,將輸出中間結果拼接得到另一部分輸出結果,計算部分輸出結果和另一部分輸出結果的和得到隱層輸出結果,將該隱層輸出結果執行后續運算得到所述循環神經網絡運算第h個輸出層的輸出結果Oit。
第二方面,本申請實施例提供了一種循環神經網絡運算裝置,其特征在于,所述循環神經網絡運算裝置包括一個或多個第一方面提供的計算裝置,用于從其他處理裝置中獲取待運算數據和控制信息,并執行指定的循環神經網絡運算,將執行結果通過I/O接口傳遞給其他處理裝置;
當所述循環神經網絡裝置包含多個所述計算裝置時,所述多個所述計算裝置間可以通過特定的結構進行連接并傳輸數據;
其中,多個所述計算裝置通過快速外部設備互連總線PCIE總線進行互聯并傳輸數據,以支持更大規模的循環神經網絡的運算;多個所述計算裝置共享同一控制系統或擁有各自的控制系統;多個所述計算裝置共享內存或者擁有各自的內存;多個所述計算裝置的互聯方式是任意互聯拓撲。
第三方面,提供一種組合處理裝置,所述組合處理裝置包括第二方面的循環神經網絡運算裝置,通用互聯接口和其他處理裝置;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中科寒武紀科技股份有限公司,未經中科寒武紀科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811429808.6/2.html,轉載請聲明來源鉆瓜專利網。





