[發明專利]面向多核微處理器的內存拷貝加速方法及裝置有效
| 申請號: | 201210493512.7 | 申請日: | 2012-11-28 |
| 公開(公告)號: | CN103019655A | 公開(公告)日: | 2013-04-03 |
| 發明(設計)人: | 郭御風;石偉;張明;竇強;龔銳;鄧宇;任巨;馬愛永;羅莉;王永文 | 申請(專利權)人: | 中國人民解放軍國防科學技術大學 |
| 主分類號: | G06F9/38 | 分類號: | G06F9/38;G06F15/167 |
| 代理公司: | 湖南兆弘專利事務所 43008 | 代理人: | 趙洪;譚武藝 |
| 地址: | 410073 湖南省長沙市硯瓦池正*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 面向 多核 微處理器 內存 拷貝 加速 方法 裝置 | ||
技術領域
本發明涉及多核微處理器領域,具體涉及一種面向多核微處理器的內存拷貝加速方法及裝置。
背景技術
隨著計算技術的高速發展,應用程序對微處理器的處理能力的要求越來越高。人們通過提高處理器主頻、采用超標量與多線程等技術來提高處理器內核的性能。然而,上述技術已經逐漸不能滿足處理器飛速發展的需要。時鐘頻率的不斷提高意味著處理器功耗激增和時鐘同步越來越困難,主流處理器已經不再一味追求高主頻。鑒于應用程序本身的并行性往往存在一定的局限性,超標量與多線程等技術也將無法進一步提高處理器的性能。處理器研究的重點逐漸轉向在開發指令級與線程級并行的基礎上進一步開發任務級并行,先進的制造工藝也使得單片上能夠集成更多的晶體管資源,多核微處理器應運而生。在多核微處理器上,一個襯底上可以制造多個處理器內核。
過去20多年來,處理器的性能以平均每年超過40%的速度增長,而存儲器性能的增速卻低得多,平均每年增長只有約7%。多核處理器的每個核都可同時執行多個不同的進程或線程,這些進程或線程都可能需要訪問存儲器,因此存儲墻問題在多核時代更加嚴重。如果存儲器無法為處理器內核提供充足的數據,多核處理器資源將無法得到充分利用。提高訪存操作的性能成為多核處理器設計者日益關心的問題。一方面,可以通過研究多核處理器的高速緩存等硬件結構以提高內核訪存性能;另一方面,可以對一些廣泛使用的訪存操作進行特殊優化。
內存拷貝操作已經成為現代計算機系統中最為常見的一種操作。而許多應用程序的性能直接或間接地依賴于內存拷貝操作的性能。TCP/IP?協議及文件拷貝等應用程序一般都包含大量的內存拷貝操作,其整體性能也很大程度上由其中內存拷貝操作所花費的時間所決定。一些操作系統函數也同樣需要內存拷貝操作的支持,如虛擬內存管理、頁管理、緩存管理及進程通信等。此外,消息傳遞通信模型已經逐漸應用于多核微處理器,而消息傳遞協議(下文中簡稱為MPI)往往由兩次內存拷貝操作實現。
在傳統的計算機系統中,內存拷貝操作一般由一系列的訪存指令Load/Store組成。在內存拷貝過程中,Load/Store指令一直占有處理器資源,阻塞后續指令執行。每條Load/Store指令都需要首先訪問快表(TLB)以將指令中的虛地址轉換為實地址,然后再訪問私有高速緩存(Cache)。也就是說,一次Load/Store操作都需要訪問一次TLB和訪問一次私有高速緩存,功耗及性能開銷較大。為了提高內存拷貝的效率,DMA技術被應用于大數據塊拷貝。但是這種基于DMA的內存拷貝技術仍存在一定的缺點,如(1)DMA設備往往需要較長的啟動時間,(2)在拷貝結束以后需要通過中斷通知內核,(3)需要操作系統的支持。
無論上述哪種內存拷貝實現方法,都存在性能相對較低的問題。此外,這些內存拷貝實現方法主要針對單核微處理器中的內存拷貝操作,而沒有給出多核微處理器中內存拷貝操作的優化方法。總之,隨著體系結構與制造工藝的不斷發展,處理器內核與存儲器帶寬之間的性能差距正在不斷加大,需要頻繁訪存的內存拷貝操作的性能制約了多核處理器整體性能的提高;另一方面,內存拷貝操作廣泛存在于各種操作系統程序及用戶程序之中。上述這種內存拷貝的重要性及其性能的低效性促使研究面向多核微處理器的內存拷貝加速方法及裝置成為一種必然。
發明內容
本發明要解決的技術問題是提供一種內存拷貝效率高、多核優化性能好、硬件設計復雜度低、兼容性好、功耗低、硬件實現簡單的面向多核微處理器的內存拷貝加速方法及裝置。
為了解決上述技術問題,本發明采用的技術方案為:
一種面向多核微處理器的內存拷貝加速方法,實施步驟如下:
1)在微處理器指令集中增加內存拷貝指令,所述內存拷貝指令包括普通內存拷貝指令、MPI點對點發送指令、MPI點對點接收指令、MPI群組發送指令和MPI群組接收指令;在微處理器中的指令執行流水線外部建立用于執行基于MPI通信的內存拷貝請求的MPI通信加速模塊;
2)將譯碼得到的內存拷貝指令轉換成對應的內存拷貝請求,如果當前內存拷貝請求為普通內存拷貝請求時,分發給指令執行流水線中的內存拷貝單元并跳轉執行步驟3);否則將內存拷貝請求分發給MPI通信加速模塊并跳轉執行步驟4);
3)內存拷貝單元將內存拷貝請求緩存到請求隊列中,并執行請求隊列中的當前內存拷貝請求,以頁為單位取回源數據并寫入目的地址;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國人民解放軍國防科學技術大學,未經中國人民解放軍國防科學技術大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210493512.7/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:變壓吸附空分設備自動適應恒定吹掃再生系統
- 下一篇:一種高效率除塵設備





