[發明專利]執行方法、裝置及相關產品在審
| 申請號: | 201910741591.0 | 申請日: | 2019-08-12 |
| 公開(公告)號: | CN112394985A | 公開(公告)日: | 2021-02-23 |
| 發明(設計)人: | 不公告發明人 | 申請(專利權)人: | 上海寒武紀信息科技有限公司 |
| 主分類號: | G06F9/30 | 分類號: | G06F9/30;G06F9/32;G06N3/063 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 201306 上海*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 執行 方法 裝置 相關 產品 | ||
本公開涉及一種執行方法、裝置及相關產品。機器學習裝置包括一個或多個指令處理裝置,用于從其他處理裝置中獲取待執行數據和控制信息,并執行指定的機器學習執行,將執行結果通過I/O接口傳遞給其他處理裝置;當機器學習執行裝置包含多個指令處理裝置時,多個指令處理裝置間可以通過特定的結構進行連接并傳輸數據。其中,多個指令處理裝置通過快速外部設備互連總線PCIE總線進行互聯并傳輸數據;多個指令處理裝置共享同一控制系統或擁有各自的控制系統、且共享內存或者擁有各自的內存;多個指令處理裝置的互聯方式是任意互聯拓撲。本公開實施例所提供的執行方法、裝置及相關產品的適用范圍廣,對收集指令的處理效率高、處理速度快。
技術領域
本公開涉及計算機技術領域,尤其涉及一種執行方法、裝置及相關產品。
背景技術
隨著科技的不斷發展,機器學習,尤其是神經網絡算法的使用越來越廣泛。其在圖像識別、語音識別、自然語言處理等領域中都得到了良好的應用。但由于神經網絡算法的復雜度越來越高,所涉及的數據執行種類和數量不斷增大。相關技術中,在對數據進行收集執行的效率低、速度慢。
發明內容
有鑒于此,本公開提出了一種執行方法、裝置及相關產品,以提高對數據進行收集執行的效率和速度。
根據本公開的第一方面,提供了一種收集指令處理裝置,所述裝置包括:
編譯模塊,用于對獲取到的收集指令進行編譯,得到編譯后的收集指令;
控制模塊,用于對編譯后的收集指令進行解析,得到所述收集指令的操作碼和操作域,并根據所述操作碼和所述操作域獲取執行收集指令所需的至少一個索引數據、至少一個待執行數據和目標地址;
執行模塊,用于根據所述索引數據從待執行數據中確定選定數據,并將所述選定數據以及所述選定數據的數目作為所述收集指令的執行結果存入所述目標地址中,
其中,所述操作碼用于指示所述收集指令對數據所進行的執行為收集執行,所述操作域包括待執行數據地址、索引數據地址和所述目標地址。
根據本公開的第二方面,提供了一種機器學習執行裝置,所述裝置包括:一個或多個上述第一方面所述的收集指令處理裝置,用于從其他處理裝置中獲取待執行數據和控制信息,并執行指定的機器學習執行,將執行結果通過I/O接口傳遞給其他處理裝置;
當所述機器學習執行裝置包含多個所述收集指令處理裝置時,所述多個所述收集指令處理裝置間可以通過特定的結構進行連接并傳輸數據;
其中,多個所述收集指令處理裝置通過快速外部設備互連總線PCIE總線進行互聯并傳輸數據,以支持更大規模的機器學習的執行;多個所述收集指令處理裝置共享同一控制系統或擁有各自的控制系統;多個所述收集指令處理裝置共享內存或者擁有各自的內存;多個所述收集指令處理裝置的互聯方式是任意互聯拓撲。
根據本公開的第三方面,提供了一種組合處理裝置,所述裝置包括:
上述第二方面所述的機器學習執行裝置、通用互聯接口和其他處理裝置;
所述機器學習執行裝置與所述其他處理裝置進行交互,共同完成用戶指定的計算操作。
根據本公開的第四方面,提供了一種機器學習芯片,所述機器學習芯片包括上述第二方面所述的機器學習絡執行裝置或上述第三方面所述的組合處理裝置。
根據本公開的第五方面,提供了一種機器學習芯片封裝結構,該機器學習芯片封裝結構包括上述第四方面所述的機器學習芯片。
根據本公開的第六方面,提供了一種板卡,該板卡包括上述第五方面所述的機器學習芯片封裝結構。
根據本公開的第七方面,提供了一種電子設備,所述電子設備包括上述第四方面所述的機器學習芯片或上述第六方面所述的板卡。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海寒武紀信息科技有限公司,未經上海寒武紀信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910741591.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:軌道交通的監控系統、方法和服務器
- 下一篇:一種電荷域采樣低噪聲像素結構





