[發明專利]一種深度學習匯編優化中的寄存器沖突避免方法有效
| 申請號: | 201611132248.9 | 申請日: | 2016-12-09 |
| 公開(公告)號: | CN106598688B | 公開(公告)日: | 2019-10-18 |
| 發明(設計)人: | 許建衛;竇曉光;劉立 | 申請(專利權)人: | 曙光信息產業(北京)有限公司 |
| 主分類號: | G06F8/41 | 分類號: | G06F8/41 |
| 代理公司: | 北京德恒律治知識產權代理有限公司 11409 | 代理人: | 章社杲;盧軍峰 |
| 地址: | 100193 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 深度 學習 匯編 優化 中的 寄存器 沖突 避免 方法 | ||
1.一種深度學習匯編優化中的寄存器沖突避免方法,所述深度學習采用Kepler顯卡進行加速,其特征在于:匯編優化時,包括以下步驟:
S10,將兩條以上的計算指令與一條數據傳輸指令均勻混合在一起,以隱藏訪存時間,其中,所述計算指令的延時為一個時鐘周期,所述數據傳輸指令的延時為兩個時鐘周期;
S20,進行矩陣乘法計算時,從四個或三個寄存器存儲體內進行取數。
2.根據權利要求1所述的一種深度學習匯編優化中的寄存器沖突避免方法,其特征在于:所述計算指令為FFMA指令。
3.根據權利要求1所述的一種深度學習匯編優化中的寄存器沖突避免方法,其特征在于:所述數據傳輸指令為LDS指令。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于曙光信息產業(北京)有限公司,未經曙光信息產業(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611132248.9/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種腳本預熱方法和裝置
- 下一篇:一種中文通用編碼方法





