[發(fā)明專利]面向非規(guī)則數據密集應用的群組式線程預取方法有效
| 申請?zhí)枺?/td> | 201710039875.6 | 申請日: | 2017-01-19 |
| 公開(公告)號: | CN106776047B | 公開(公告)日: | 2019-08-02 |
| 發(fā)明(設計)人: | 黃艷;谷培培;李玉華;張啟坤;朱會東;梁樹軍;范乃梅 | 申請(專利權)人: | 鄭州輕工業(yè)學院 |
| 主分類號: | G06F9/50 | 分類號: | G06F9/50;G06F9/48 |
| 代理公司: | 鄭州優(yōu)盾知識產權代理有限公司 41125 | 代理人: | 張真真;栗改 |
| 地址: | 450002 *** | 國省代碼: | 河南;41 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 面向 規(guī)則 數據 密集 應用 群組式 線程 方法 | ||
1.一種面向非規(guī)則數據密集應用的群組式線程預取方法,其特征在于,采用在線剖析技術獲取非規(guī)則數據密集應用的執(zhí)行時特征,確定合理的預取率構建群組式預取線程實現有效數據預取,其步驟如下:
包括非規(guī)則數據訪存特征剖析、群組式預取線程構建及線程預取中同步機制的確立;
所述非規(guī)則數據訪存特征剖析包括:
A)使用VTUNE性能分析器獲取非規(guī)則數據密集應用的執(zhí)行行為特征;
B)使用VTUNE性能分析器獲取熱點循環(huán)相對延遲的計算延遲
所述群組式預取線程構建包括:
C) 判斷計算延遲
D) 當
E) 利用切片技術基于預取率
群組式線程預取方法根據輔助線程能夠隱藏的訪存延遲比例分配預取數據群組;
首先使用程序profile工具VTUNE性能分析器在運行時測試代碼的長延遲的訪存指令,并以profile文件的形式保存下來;其次,編譯器根據profile文件信息和選定的循環(huán)區(qū)域將要預取的關鍵指令抽取出來即根據預取率只選擇部分循環(huán)依賴取數指令,并保留對循環(huán)結構有影響的代碼,刪除其它非關鍵的代碼,完成切片形成輔助線程的代碼塊;最后,將切片后的代碼移植到輔助線程中,在主線程中插入輔助線程觸發(fā)指令,并在輔助線程和主線程中插入同步代碼塊,保證幫助線程正常而有效的執(zhí)行;
所述線程預取中同步機制的確立包括:
F) 在主線程熱點循環(huán)入口處設置標志位flag為1,向預取線程發(fā)出信號,通知預取線程開始預取工作;在主線程熱點循環(huán)出口處設置標志位flag為0,向預取線程發(fā)送暫停信號,通知預取線程暫停預取,等待下一次預取信號。
2.根據權利要求1所述的面向非規(guī)則數據密集應用的群組式線程預取方法,其特征在于,所述執(zhí)行行為特征包括頻繁發(fā)生共享緩存L2 Cache失效行為的各個熱點循環(huán)所在的函數名稱、各熱點循環(huán)的CPU時鐘消耗情況、共享緩存L2 Cache失效情況和預取平臺訪存情況。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于鄭州輕工業(yè)學院,未經鄭州輕工業(yè)學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710039875.6/1.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發(fā)送方法、數據發(fā)送系統、數據發(fā)送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發(fā)送和數據接收設備、數據發(fā)送和數據接收方法
- 數據發(fā)送裝置、數據接收裝置、數據收發(fā)系統、數據發(fā)送方法、數據接收方法和數據收發(fā)方法
- 數據發(fā)送方法、數據再現方法、數據發(fā)送裝置及數據再現裝置
- 數據發(fā)送方法、數據再現方法、數據發(fā)送裝置及數據再現裝置





