[發明專利]一種基于數據并行的深度學習處理器架構及方法有效
| 申請號: | 201810179977.2 | 申請日: | 2018-03-05 |
| 公開(公告)號: | CN108334474B | 公開(公告)日: | 2021-11-19 |
| 發明(設計)人: | 朱順意 | 申請(專利權)人: | 山東領能電子科技有限公司 |
| 主分類號: | G06F15/78 | 分類號: | G06F15/78;G06F9/50 |
| 代理公司: | 濟南金迪知識產權代理有限公司 37219 | 代理人: | 楊樹云 |
| 地址: | 250101 山東省濟南市歷下*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 數據 并行 深度 學習 處理器 架構 方法 | ||
本發明涉及一種基于數據并行的深度學習處理器架構及方法,包括輸入緩存區(In_Buf)、PE陣列、若干個片上緩存區、輸出緩存區(Out_Buf),相鄰的兩個N*N的PE陣列之間設有一組片上緩存區;本發明通過配置N*N的PE陣列,可以實現數據的片上傳輸并最大程度地減小數據與片外的雙向傳輸,減少了傳統神經網絡數據的片上與片外傳輸的能量消耗,為減少神經網絡能耗問題提供了新的解決方案。
技術領域
本發明涉及一種基于數據并行的深度學習處理器架構及方法,屬于集成電路處理器架構設計技術領域。
背景技術
深度學習的概念源于人工神經網絡的研究。深度學習的概念由Hinton等人于2006年提出。基于深度置信網絡(DBN)提出非監督貪心逐層訓練算法,為解決深層結構相關的優化難題帶來希望,隨后提出多層自動編碼器深層結構。此外Lecun等人提出的卷積神經網絡是第一個真正多層結構學習算法,它利用空間相對關系減少參數數目以提高訓練性能。
深度學習是機器學習中一種基于對數據進行表征學習的方法。觀測值(例如一幅圖像或者一組數據)可以使用多種方式來表示,對于圖像來說,如每個像素強度值的向量,或者更抽象地表示成一系列邊、特定形狀的區域等。使用某些特定的表示方法能夠從實例中學習任務(例如,人臉識別或面部表情識別)。深度學習的好處是用非監督式或半監督式的特征學習和分層特征提取的高效算法來替代手工獲取特征。深度學習通過組合低層特征形成更加抽象的高層表示屬性類別或特征,以發現數據的分布式特征表示。
深度學習旨在通過模擬人腦機制的神經網絡來解釋數據并進行分析學習。因此,深度學習需要大量的數據處理和存儲。當今主流的神經網絡在運行時需要進行大量的數據計算與傳輸,其中片上與片外的雙向數據傳輸造成了大量的能量損耗,中間數據和輸出數據的存取消耗了大量的功耗和數據帶寬,無法實現能耗的最優化。所以,最大限度地減少數據訪問頻率和存取交換,可以有效地減少功耗。
發明內容
針對現有技術的不足,本發明提供了一種基于數據并行的深度學習處理器架構;
本發明還提供了一種基于數據并行的深度學習方法;
術語解釋:
1、PE,Processing Element,為最基本的處理單元,PE矩陣指N*N個PE處理單元組成的PE矩陣。
2、計算周期,對于圖像的處理,需要進行若干次卷積與池化計算,在每一個周期,PE處理器進行一次卷積或池化計算并將數據暫存于片上緩存SRAM中。
卷積計算,又稱PE處理器對圖像的濾波過程。濾波就是對于每一幀中的每個像素,計算它周圍像素和濾波器矩陣對應位置元素的乘積,然后把結果相加到一起,最終得到的值就作為該像素的新值,這樣就完成了一次濾波。對圖片的每一個像素完成一次卷積,計為一次計算周期,即卷積計算周期完成。對于邊緣區域,采用對原圖像周圍擴展補零操作,使濾波器完成計算。如圖4所示,(a)為例圖像素,(b)為濾波器,(C)為單像素卷積后圖像;對應元素相乘,1*0+2*1+3*0+2*1+2*1+4*0+1*0+3*1+5*0=9,對圖像所有像素卷積完成后,一次計算周期完成。
池化計算,Pooling計算,為了描述大的圖像,可以對不同位置的特征進行聚合統計,如計算平均值或者是最大值,即mean-pooling和max-pooling。
本發明的技術方案為:
一種基于數據并行的深度學習處理器架構,包括輸入緩存區(In_Buf)、PE陣列、若干個片上緩存區(SRam)、輸出緩存區(Out_Buf),相鄰的兩個PE陣列之間設有一組片上緩存區;
由于數據由片外到片上的讀寫能耗較大,將片外數據寫入所述輸入緩存區暫存并進行預讀取,使得PE陣列讀取所述輸入緩存區的數據的同時,所述輸入緩存區同步從片外讀取數據;增加了數據讀寫的連續性。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于山東領能電子科技有限公司,未經山東領能電子科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810179977.2/2.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





