[發明專利]用于提高卷積效率的方法、系統和裝置在審
| 申請號: | 201880047459.3 | 申請日: | 2018-05-18 |
| 公開(公告)號: | CN111133452A | 公開(公告)日: | 2020-05-08 |
| 發明(設計)人: | S·鮑爾;D·莫洛尼;B·巴里;F·康納 | 申請(專利權)人: | 莫維迪烏斯有限公司 |
| 主分類號: | G06N3/063 | 分類號: | G06N3/063;G06N3/04;G06K9/62;G06K9/00 |
| 代理公司: | 永新專利商標代理有限公司 72002 | 代理人: | 劉文燦 |
| 地址: | 愛爾蘭*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 提高 卷積 效率 方法 系統 裝置 | ||
公開了用于提高卷積神經網絡(CNN)加速器的卷積效率的方法、裝置、系統和制品。示例裝置包括:數據處理元件(DPE)庫存引擎,其用于識別被包括在DPE陣列中的平臺可用的DPE;模式選擇器,其用于確定DPE中的所識別的DPE的卷積布置;DPE配置優化器,其用于基于DPE中的所識別的DPE來確定DPE利用率;以及卷積引擎,其用于當DPE利用率滿足DPE利用率門限時,使用所識別的DPE來促進卷積運算。
相關申請
該專利始自要求享有于2017年5月19日提交的序列號為62/508,896的美國臨時專利申請的利益的申請。序列號為62/508,896的美國臨時專利申請特此通過引用方式全部并入本文。特此要求享有序列號為62/508,896的美國臨時專利申請的優先權。
技術領域
概括而言,本公開涉及圖像處理,并且更具體而言,涉及用于提高卷積效率的方法、系統和裝置。
背景技術
近年來,對圖像處理能力的需求已經超出大功率專用桌上型硬件的范圍,并且已經成為個人和/或其它移動設備的期望。移動設備通常包括受尺寸約束、溫度管理約束和/或電源約束所限制的處理能力。
附圖說明
圖1示出了使用卷積的示例輸入體積和示例輸出體積的示例卷積運算。
圖2示出了基于“每個輸出位置”的示例多通道卷積運算。
圖3示出了示例池化操作的示意圖。
圖4示出了示例全連接操作的示意圖。
圖5示出了示例卷積神經網絡(CNN)加速器的框圖。
圖6示出了示例數據路徑元件(DPE)。
圖7是示例系數存儲庫的圖示。
圖8是描述用于示例系數存儲的示例尋址模型的示例表。
圖9是描述基于非FP16格式的示例系數存儲庫的示例尋址模型的示例表。
圖10示出了用于實現本文公開的示例的示例卷積運算。
圖11示出了基于示例1*256卷積布置的示例連接復用器的示例操作。
圖12示出了基于示例2*128卷積布置的示例連接復用器的示例操作。
圖13是用于實現圖5的示例CNN加速器的另一示例CNN加速器的示例實施方式的框圖。
圖14是表示可以被執行以實現圖5的CNN加速器和/或圖13的CNN加速器來處理與輸入圖像相關聯的圖像數據的示例機器可讀指令的流程圖。
圖15是表示可以被執行以實現圖5的CNN加速器和/或圖13的CNN加速器來執行具有可選池化的卷積運算的示例機器可讀指令的流程圖。
圖16是表示可以被執行以實現圖5的CNN加速器和/或圖13的CNN加速器來執行重疊池化操作的示例機器可讀指令的流程圖。
圖17是表示可以被執行以實現圖5的CNN加速器和/或圖13的CNN加速器來執行全連接操作的示例機器可讀指令的流程圖。
圖18是表示可以被執行以實現圖5的CNN加速器和/或圖13的CNN加速器來配置示例累加器的示例機器可讀指令的流程圖。
圖19是示例處理器平臺的框圖,所述示例處理器平臺被構造為執行圖14-18的示例機器可讀指令來實現圖13的示例CNN加速器。
附圖未按比例繪制。通常,在整個附圖和所附的書面描述中將使用相同的附圖標記來指代相同或相似的部分。
具體實施方式
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于莫維迪烏斯有限公司,未經莫維迪烏斯有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201880047459.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:預處理組件和處理工件的方法
- 下一篇:化妝用或皮膚病學的油包水乳液





