[發明專利]用于深度學習加速的池化單元在審
| 申請號: | 202110203807.5 | 申請日: | 2021-02-23 |
| 公開(公告)號: | CN113298228A | 公開(公告)日: | 2021-08-24 |
| 發明(設計)人: | S·P·辛格;T·勃伊施;G·德索利 | 申請(專利權)人: | 意法半導體股份有限公司;意法半導體國際有限公司 |
| 主分類號: | G06N3/04 | 分類號: | G06N3/04;G06N3/063;G06N3/08 |
| 代理公司: | 北京市金杜律師事務所 11256 | 代理人: | 王茂華 |
| 地址: | 意大利阿格*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 深度 學習 加速 單元 | ||
根據本公開的各實施例涉及用于深度學習加速的池化單元。卷積神經網絡包括池化單元。池化單元在卷積神經網絡的卷積層之間執行池化操作。池化單元包括提高卷積神經網絡中的計算效率和面積效率的硬件塊。
技術領域
本公開總體上涉及在電子系統中實現的卷積神經網絡。
背景技術
深度學習算法在涉及識別、標識和/或分類任務的許多應用中促進了非常高的性能,然而,這種進步可能以處理能力方面的顯著需求為代價。因此,由于缺乏低成本和節能的解決方案,它們的采用可能會受到阻礙。因此,當在嵌入式設備上部署深度學習應用時,嚴格的性能規范可以與功耗和能耗方面的嚴格限制共存。
發明內容
一個實施例是一種卷積神經網絡的池化單元。池化單元包括裁剪器,裁剪器被配置為接收特征張量并通過裁剪特征張量來生成包括多個數據值的經裁剪的特征張量。池化單元包括:行緩沖器(line buffer),被配置為從裁剪器接收數據值;列計算器,被配置為對來自行緩沖器的數據列執行列池化操作;以及行計算器(row calculator),被配置為對來自列計算器的數據行執行行池化操作。
一個實施例是一種方法,該方法包括在卷積神經網絡的池化單元中接收特征張量,以及通過利用池化單元的裁剪器裁剪特征張量來生成包括多個數據值的經裁剪的特征張量。該方法包括將經裁剪的特征張量的數據值傳遞給池化單元的單端口行緩沖器。該方法包括通過對來自行緩沖器的數據值執行列池化計算和行池化計算來生成經池化的特征數據
一個實施例是一種方法。該方法包括:在卷積神經網絡的池化單元中接收特征張量,在池化單元的配置寄存器中存儲池化窗口尺寸數據,以及根據池化窗口尺寸數據,利用池化單元從特征張量生成多個池化窗口。該方法包括通過對來自池化窗口的數據值執行列池化計算和行池化計算來生成經池化的特征數據。
附圖說明
圖1是根據一個實施例的電子設備的框圖。
圖2是根據一個實施例的卷積神經網絡內的處理流程的框圖。
圖3是根據一個實施例的特征張量的表示。
圖4是根據一個實施例的池化單元的框圖。
圖5A是根據一個實施例的由裁剪器執行的裁剪操作的示意圖。
圖5B是根據一個實施例的裁剪器的裁剪操作的示意圖。
圖6A是根據一個實施例的池化單元的行緩沖器的示意圖。
圖6B示出了根據一個實施例的池化單元的行緩沖器的操作。
圖7A示出了根據一個實施例的池化單元的填充控制的操作。
圖7B是根據一個實施例的池化單元的列計算器的示意圖。
圖8示出了根據一個實施例的池化單元的批量緩沖器的操作。
圖9示出了根據一個實施例的池化單元的批量緩沖器和行計算器的操作。
圖10示出了根據一個實施例的由池化單元執行的池化操作。
圖11是根據一個實施例的用于操作卷積神經網絡的方法的流程圖。
圖12是根據一個實施例的用于操作卷積神經網絡的方法的流程圖。
具體實施方式
圖1是根據一個實施例的電子設備100的框圖。電子設備100包括卷積神經網絡(CNN)102。CNN 102接收輸入數據110,并基于輸入數據110生成預測數據112。CNN 102通過對輸入數據110執行一個或多個卷積操作來生成預測數據112。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于意法半導體股份有限公司;意法半導體國際有限公司,未經意法半導體股份有限公司;意法半導體國際有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110203807.5/2.html,轉載請聲明來源鉆瓜專利網。





