[發明專利]深度學習softmax分類器的硬件實現電路及其控制方法有效
| 申請號: | 201711039589.6 | 申請日: | 2017-10-30 |
| 公開(公告)號: | CN109726809B | 公開(公告)日: | 2020-12-08 |
| 發明(設計)人: | 張玉;康君龍;謝東亮 | 申請(專利權)人: | 賽靈思公司 |
| 主分類號: | G06N3/08 | 分類號: | G06N3/08;G06F7/485;G06F7/487;G06F7/556 |
| 代理公司: | 北京卓孚律師事務所 11821 | 代理人: | 任宇 |
| 地址: | 美國加利福尼亞*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 深度 學習 softmax 分類 硬件 實現 電路 及其 控制 方法 | ||
1.一種softmax分類器的硬件實現電路,包括:
接口數據讀控制模塊,用于從外部存儲器中讀取計算數據給指數計算模塊;
指數計算模塊,用于并行地進行浮點元素的指數運算;
加法樹模塊,用于進行指數計算模塊的運算結果的累加運算;
緩存模塊,用于緩存指數計算模塊的運算結果以及加法樹模塊的累加運算結果;
除法計算模塊,用于并行地計算各個浮點元素的指數運算結果與所有浮點元素指數運算結果之和的比值;
接口數據寫控制模塊,用于將除法計算模塊的計算結果寫入外部存儲器中。
2.根據權利要求1所述的硬件實現電路,其中,所述指數計算模塊和所述除法計算模塊的計算并行度取決于模塊接口的數據帶寬,如下公式所示:
IO_data_width×IO_freq=Calc_num×Calc_data_width×Calc_freq,
其中IO_data_width是IO數據位寬,IO_freq是IO接口數據頻率,Calc_num是計算模塊的并行度,Calc_data_width是每一個計算單元支持的數據位寬,Calc_freq是計算模塊的運行頻率。
3.根據權利要求1或2所述的硬件實現電路,其中,所述指數計算模塊和所述除法計算模塊的計算并行度為4,所述指數計算模塊包括4個指數計算單元,所述除法計算模塊包括4個除法計算單元,所述加法樹模塊包括2級共3個浮點加法計算單元。
4.根據權利要求1所述的硬件實現電路,其中,所述緩存模塊包括指數運算結果緩存和累加運算結果緩存。
5.根據權利要求4所述的硬件實現電路,其中,所述指數運算結果緩存和所述累加運算結果緩存都采用先進先出(FIFO)結構。
6.一種softmax分類器的硬件實現電路的控制方法,包括:
接口數據讀控制模塊從外部存儲器中讀取要計算的數據;
數據并行進入指數計算模塊,進行浮點元素的指數運算;
指數計算模塊的運算結果在加法樹模塊進行累加運算;
通過緩存模塊來緩存指數計算模塊的運算結果以及加法樹模塊的累加運算結果;
通過讀取緩存模塊,在除法計算模塊并行地計算各個浮點元素的指數運算結果與所有浮點元素指數運算結果之和的比值;
將除法計算模塊的計算結果經接口數據寫控制模塊寫入外部存儲模塊。
7.根據權利要求6所述的控制方法,其中,所述指數計算模塊和所述除法計算模塊的計算并行度取決于模塊接口的數據帶寬,如下公式所示:
IO_data_width×IO_freq=Calc_num×Calc_data_width×Calc-freq,
其中IO_data_width是IO數據位寬,IO_freq是IO接口數據頻率,Calc_num是計算模塊的并行度,Calc_data_width是每一個計算單元支持的數據位寬,Calc_freq是計算模塊的運行頻率。
8.根據權利要求6或7所述的控制方法,其中,所述指數計算模塊和所述除法計算模塊的計算并行度為4,所述指數計算模塊包括4個指數計算單元,所述除法計算模塊包括4個除法計算單元,所述加法樹模塊包括2級共3個浮點加法計算單元。
9.根據權利要求6所述的控制方法,其中,所述緩存模塊包括指數運算結果緩存和累加運算結果緩存。
10.根據權利要求9所述的控制方法,其中,所述指數運算結果緩存和所述累加運算結果緩存都采用先進先出(FIFO)結構。
11.一種計算機可讀介質,用于記錄可由處理器執行的指令,所述指令在被處理器執行時,使得處理器執行softmax分類器的硬件實現電路的控制方法,包括如下操作:
接口數據讀控制模塊從外部存儲器中讀取要計算的數據;
數據并行進入指數計算模塊,進行浮點元素的指數運算;
指數計算模塊的運算結果在加法樹模塊進行累加運算;
通過緩存模塊來緩存指數計算模塊的運算結果以及加法樹模塊的累加運算結果;
通過讀取緩存模塊,在除法計算模塊并行地計算各個浮點元素的指數運算結果與所有浮點元素指數運算結果之和的比值;
將除法計算模塊的計算結果經接口數據寫控制模塊寫入外部存儲模塊。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于賽靈思公司,未經賽靈思公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711039589.6/1.html,轉載請聲明來源鉆瓜專利網。





