[發明專利]用于將可執行對象適配到處理單元的系統和方法在審
| 申請號: | 201911082280.4 | 申請日: | 2019-11-07 |
| 公開(公告)號: | CN112785482A | 公開(公告)日: | 2021-05-11 |
| 發明(設計)人: | 許莉;向海浩;陳峰;T·施呂斯列爾;張玉珩;林森 | 申請(專利權)人: | 英特爾公司 |
| 主分類號: | G06T1/20 | 分類號: | G06T1/20;G06F9/38;G06F9/50;G06T5/00 |
| 代理公司: | 上海專利商標事務所有限公司 31100 | 代理人: | 周全;黃嵩泉 |
| 地址: | 美國加利*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 可執行 對象 適配到 處理 單元 系統 方法 | ||
1.一種用于將可執行對象從第一處理單元適配到第二處理單元的方法,所述方法包括:
將針對具有第一架構的所述第一處理單元優化的所述可執行對象適配到具有第二架構的所述第二處理單元,
其中,所述第二架構與所述第一架構不同,
其中,基于當所述可執行對象在所述第一處理單元和所述第二處理單元上被執行時所收集的多個性能度量,所述可執行對象被適配成在所述第二處理單元上執行。
2.如權利要求1所述的方法,進一步包括:
基于當所述可執行對象在所述第一處理單元上被執行時的所述可執行對象的第一多個性能度量以及當所述可執行對象在所述第二處理單元上被執行時的所述可執行對象的第二多個性能度量來識別所述可執行對象的性能方面,其中,所述多個性能度量包括所述第一多個性能度量和所述第二多個性能度量;
判定所識別的性能方面是否存在于數據庫中,所述數據庫限定性能方面與適配操作之間的對應關系;以及
響應于判定了所述所識別的性能方面存在于所述數據庫中,將所述數據庫中與所述所識別的性能方面對應的適配操作應用于所述可執行對象。
3.如權利要求2所述的方法,其中,所述數據庫進一步包括與所述性能方面對應的架構變化,并且
所述將適配操作應用于所述可執行對象的步驟包括:
基于所述所識別的性能方面確定所述第二架構相對于所述第一架構的架構變化;以及
將與所確定的架構變化對應的適配操作應用于所述可執行對象。
4.如權利要求2或3所述的方法,其中,所述所識別的性能方面包括指令高速緩存利用、常量高速緩存利用、數據高速緩存利用、以及數據處理效率。
5.如權利要求4所述的方法,其中,所述指令高速緩存利用包括指令高速緩存等待時間,并且與所述指令高速緩存等待時間對應的適配操作包括禁用循環展開。
6.如權利要求4所述的方法,其中,所述常量高速緩存利用包括常量高速緩存等待時間覆蓋范圍,并且與所述常量高速緩存等待時間覆蓋范圍對應的適配操作包括常量折疊。
7.如權利要求4所述的方法,其中,所述數據高速緩存利用包括數據高速緩存未命中率,并且與所述數據高速緩存未命中率對應的適配操作包括減少工作集或改變數據訪問模式。
8.如權利要求4所述的方法,其中,所述數據處理效率包括計算吞吐量,并且與所述計算吞吐量對應的適配操作包括減少指令計數。
9.如權利要求2所述的方法,其中,所述性能方面是使用基于機器學習的算法或決策樹流來識別的。
10.如權利要求2所述的方法,進一步包括:響應于判定了所述所識別的性能方面不存在于所述數據庫中,呈現所述所識別的性能方面。
11.如權利要求3所述的方法,進一步包括:響應于判定了所述所識別的性能方面不存在于所述數據庫中,呈現所確定的架構變化。
12.如權利要求1所述的方法,其中,所述第一處理單元是支持SIMD架構的圖形處理單元,并且所述第二處理單元是支持SIMT架構的圖形處理單元。
13.一種用于將可執行對象從第一處理單元適配到第二處理單元的裝置,所述裝置包括:
數據存儲,用于存儲數據庫;以及
處理器,耦合到所述數據庫,所述處理器用于:
將針對具有第一架構的所述第一處理單元優化的所述可執行對象適配到具有第二架構的所述第二處理單元,
其中,所述第二架構與所述第一架構不同,
其中,基于當所述可執行對象在所述第一處理單元和所述第二處理單元上被執行時所收集的多個性能度量,所述可執行對象被適配成在所述第二處理單元上執行。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于英特爾公司,未經英特爾公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911082280.4/1.html,轉載請聲明來源鉆瓜專利網。





