[發明專利]運算方法、裝置及相關產品有效
| 申請號: | 201910671036.5 | 申請日: | 2019-07-24 |
| 公開(公告)號: | CN110377340B | 公開(公告)日: | 2021-06-01 |
| 發明(設計)人: | 不公告發明人 | 申請(專利權)人: | 中科寒武紀科技股份有限公司 |
| 主分類號: | G06F9/38 | 分類號: | G06F9/38;G06F9/30 |
| 代理公司: | 北京林達劉知識產權代理事務所(普通合伙) 11277 | 代理人: | 劉新宇 |
| 地址: | 100190 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 運算 方法 裝置 相關 產品 | ||
本公開涉及運算方法、裝置及相關產品,所述產品包括控制器單元,所述控制器單元包括:指令緩存單元、指令處理單元和存儲隊列單元;所述指令緩存單元,用于存儲所述人工神經網絡運算關聯的計算指令;所述指令處理單元,用于對所述計算指令解析得到多個運算指令;所述存儲隊列單元,用于存儲指令隊列,該指令隊列包括:按該隊列的前后順序待執行的多個運算指令或計算指令。通過以上方法,本公開可以提高相關產品在進行神經網絡模型的運算時的運算效率。
技術領域
本公開涉及信息處理技術領域,尤其涉及一種運算方法、裝置及相關產品。
背景技術
在人工智能技術領域,神經網絡算法是最近非常流行的一種機器學習算法,在各種領域中都取得了非常好的效果,比如圖像識別,語音識別,自然語言處理等。隨著神經網絡算法的發展,算法的復雜度也越來越高,為了提高識別度,模型的規模也在逐漸增大。
發明內容
根據本公開的第一方面,提供了一種指令生成方法,所述方法包括:
接收計算圖;
統計所述計算圖中的調度節點,得到第一調度集合;
將所述第一調度集合中的并行節點合并為并行調度單元,得到包括并行調度單元的第二調度集合,其中,所述并行節點為符合并行執行條件的調度節點;
根據所述第二調度集合,生成指令。
根據本公開的第二方面,提供了一種指令生成裝置,包括:
接收單元,用于接收計算圖;
統計單元,用于統計所述計算圖中的調度節點,得到第一調度集合;
合并單元,用于將所述第一調度集合中的并行節點合并為并行調度單元,得到包括并行調度單元的第二調度集合,其中,所述并行節點為符合并行執行條件的調度節點;
指令生成單元,用于根據所述第二調度集合,生成指令。
根據本公開的第三方面,提供了一種運算裝置,包括:
處理器;
用于存儲處理器可執行指令的存儲器;
其中,所述處理器被配置為執行上述第一方面所述的方法。
根據本公開的第四方面,提供了一種非易失性計算機可讀存儲介質,其上存儲有計算機程序指令,所述計算機程序指令被處理器執行時實現上述第一方面所述的方法。
通過將第一調度集合中的并行節點合并為并行調度單元,從而得到包括并行調度單元的第二調度集合,并根據第二調度集合生成指令,根據本公開的各方面實施例的指令生成方法、裝置及相關產品,能夠生成可以并行執行的并行指令,從而便于對不存在依賴關系的數據段進行并行處理和計算,提升數據處理和計算的效率。
根據下面參考附圖對示例性實施例的詳細說明,本公開的其它特征及方面將變得清楚。
附圖說明
包含在說明書中并且構成說明書的一部分的附圖與說明書一起示出了本公開的示例性實施例、特征和方面,并且用于解釋本公開的原理。
圖1示出根據本公開一實施例的指令生成方法的流程圖。
圖2示出根據本公開一實施例的指令生成方法的流程圖。
圖3示出根據本公開一實施例的計算圖。
圖4示出根據本公開一實施例的指令生成方法的流程圖。
圖5示出根據本公開一應用示例的示意圖。
圖6示出根據本公開一實施例的指令生成裝置的框圖。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中科寒武紀科技股份有限公司,未經中科寒武紀科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910671036.5/2.html,轉載請聲明來源鉆瓜專利網。





