[發明專利]機器學習指令的轉換方法及裝置、板卡、主板、電子設備在審
| 申請號: | 202011115613.1 | 申請日: | 2019-11-08 |
| 公開(公告)號: | CN112257870A | 公開(公告)日: | 2021-01-22 |
| 發明(設計)人: | 不公告發明人 | 申請(專利權)人: | 安徽寒武紀信息科技有限公司 |
| 主分類號: | G06N20/00 | 分類號: | G06N20/00;G06F8/41 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 231283 安徽省合肥市高新區習友路3333*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 機器 學習 指令 轉換 方法 裝置 板卡 主板 電子設備 | ||
本申請涉及一種機器學習指令的轉換方法及裝置、板卡、主板、電子設備,通過獲取機器學習指令序列,并對該機器學習指令序列進行劃分,得到至少一個基本塊,進而根據窺孔優化算法對基本塊中的機器學習指令進行指令轉換,得到轉換后的機器學習指令,從而實現了對機器學習指令的窺孔優化,減少了機器學習指令的時間開銷,大大提升了機器學習計算裝置的整體性能。
技術領域
本申請涉及數據處理技術領域,特別是涉及一種機器學習指令的轉換方法及裝置、板卡、主板、電子設備。
背景技術
近年來,機器學習飛速發展,主要是機器學習可以滿足人們對于巨大數據量的超快處理需求。機器學習運算是一種功能強大的算法,近年來被應用于圖像、語言等領域。
窺孔優化是一種很局部的優化方式,是指編譯器針對已經生成的代碼,結合CPU指令的特點,通過一些可能帶來性能提升的轉換規則,或者通過整體的分析,通過指令轉換,以此提升代碼性能。
然而,傳統技術缺乏對機器學習計算裝置中的機器學習指令進行窺孔優化的方案,因此,如何實現對機器學習指令的窺孔優化,成為本領域技術人員亟待解決的問題。
發明內容
基于此,有必要針對上述如何實現對機器學習指令的窺孔優化的技術問題,提供一種機器學習指令的轉換方法及裝置、板卡、主板、電子設備。
一種機器學習指令的轉換方法,其特征在于,所述方法包括:
獲取機器學習指令序列;
對所述機器學習指令序列進行劃分,得到至少一個基本塊,其中,所述基本塊中包括至少一條機器學習指令;
根據窺孔優化算法對所述基本塊中的機器學習指令進行指令轉換,得到轉換后的機器學習指令。
在其中一個實施例中,所述對所述機器學習指令序列進行劃分,得到至少一個基本塊,包括:
查找所述機器學習指令序列中的跳轉指令;
根據所述跳轉指令對所述機器學習指令序列進行劃分,得到至少一個基本塊。
在其中一個實施例中,所述根據窺孔優化算法對所述基本塊中的機器學習指令進行指令轉換,得到轉換后的機器學習指令,包括:
獲取所述基本塊中的第一偏移寄存器指令;
根據所述第一偏移寄存器指令,查找所述基本塊中的第二偏移寄存器指令,其中,所述第一偏移寄存器指令和所述第二偏移寄存器指令用于對同一個寄存器中的值進行偏移;
若所述第一偏移寄存器指令和所述第二偏移寄存器指令之間不存在使用所述寄存器中的值的機器學習指令,則合并所述第一偏移寄存器指令和所述第二偏移寄存器指令,得到合并后的偏移寄存器指令。
在其中一個實施例中,所述根據窺孔優化算法對所述基本塊中的機器學習指令進行指令轉換,得到轉換后的機器學習指令,包括:
獲取所述基本塊中的可提前機器學習指令;
對所述可提前機器學習指令進行位置前移,并根據所述可提前機器學習指令前移后的位置,判斷所述機器學習指令序列是否存在邏輯錯誤;
若所述機器學習指令序列存在邏輯錯誤,則停止對所述可提前機器學習指令進行位置前移,并將所述可提前機器學習指令放置于所述機器學習指令序列不存在邏輯錯誤所對應的任一前移后的位置。
在其中一個實施例中,所述獲取所述基本塊中的可提前機器學習指令,包括:
將所述基本塊中的機器學習指令與預設的可提前機器學習指令進行匹配,得到所述基本塊中的可提前機器學習指令。
在其中一個實施例中,對所述可提前機器學習指令進行位置前移,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于安徽寒武紀信息科技有限公司,未經安徽寒武紀信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011115613.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:輪轂驅動系統
- 下一篇:語音關鍵詞識別方法、裝置、計算機設備和存儲介質





