[發(fā)明專利]采用集成GPU來加速元組空間搜索的架構(gòu)和機制在審
| 申請?zhí)枺?/td> | 201811465445.1 | 申請日: | 2018-12-03 |
| 公開(公告)號: | CN110032442A | 公開(公告)日: | 2019-07-19 |
| 發(fā)明(設(shè)計)人: | 王任;J.曾;蔡志賢;戴宗元 | 申請(專利權(quán))人: | 英特爾公司 |
| 主分類號: | G06F9/50 | 分類號: | G06F9/50;G06F9/54;G06F16/901 |
| 代理公司: | 中國專利代理(香港)有限公司 72001 | 代理人: | 徐予紅;楊美靈 |
| 地址: | 美國加利*** | 國省代碼: | 美國;US |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 架構(gòu) 元組空間 搜索 并行性 查找表 子表 排序 圖形處理器單元 平衡處理器 并行處理 應(yīng)用偏好 重新排序 分組級 通配符 預(yù)篩選 直方圖 自適應(yīng) 可用 兩級 掩碼 元組 命中率 吞吐量 匹配 命中 工作組 全局 | ||
1.一種用于執(zhí)行流分類的方法,包括:
在中央處理單元(CPU)和圖形處理單元(GPU)的每個的可訪問的存儲器的多個緩沖器中緩沖多個分組;
使用所述GPU來執(zhí)行使用多個工作組的所述多個分組的并行流分類,每個工作組與工作項的相應(yīng)集合關(guān)聯(lián)并且用來使用批量過程來處理分組的相應(yīng)批量;
對于由批量過程所處理的每個分組,
通過將由所述分組的報頭中的字段所定義的元組與工作項的多個子表之一中的規(guī)則進行匹配,來執(zhí)行使用所述工作項的分組的流分類,其中所述多個子表按照搜索順序來順序搜索;
保持一個或多個命中計數(shù)直方圖,其中每次找到給定子表中的規(guī)則的元組匹配時,使那個子表的所述命中計數(shù)遞增;以及
使用命中計數(shù)直方圖來重新排序一個或多個工作項的所述子表的所述搜索順序。
2.如權(quán)利要求1所述的方法,其中所述方法在包括CPU和集成GPU的處理器上執(zhí)行。
3.如權(quán)利要求1或2所述的方法,還包括:
保持全局命中計數(shù)直方圖,其中所述全局命中計數(shù)直方圖存儲跨全部所述工作項并且跨全部所述工作組的每個子表的命中計數(shù)的集合。
4.如權(quán)利要求3所述的方法,還包括:
存儲每個工作組的局部直方圖,其包含由給定批量過程的所述工作組的工作項所處理的每個子表的命中計數(shù);
與完成批量過程結(jié)合,
采用所述局部命中計數(shù)直方圖來更新所述全局命中計數(shù)直方圖;以及
重置所述局部命中計數(shù)直方圖。
5.如權(quán)利要求4所述的方法,還包括:
基于所述全局命中計數(shù)直方圖的當前狀態(tài)周期地重新排序一個或多個工作項的所述子表的所述順序。
6.如前述權(quán)利要求中任一項所述的方法,其中對于給定工作組的給定批量過程,并行地執(zhí)行所述批量中的分組的至少一部分的流分類。
7.如前述權(quán)利要求中任一項所述的方法,其中對于給定工作組的給定批量過程,并行地執(zhí)行所述批量中的全部所述分組的流分類。
8.如前述權(quán)利要求中任一項所述的方法,其中所述方法通過運行每個工作組的連續(xù)GPU線程來實現(xiàn)。
9. 如前述權(quán)利要求中任一項所述的方法,其中所述方法使用在所述CPU上運行的OpenvSwitch軟件組件來實現(xiàn)。
10.如前述權(quán)利要求中任一項所述的方法,其中所述方法使用在所述CPU上運行的數(shù)據(jù)平面開發(fā)套件(DPDK)軟件組件來實現(xiàn)。
11.一種系統(tǒng),包括:
處理器,所述處理器具有包括多個處理器核的中央處理單元(CPU)、具有多個處理元件的圖形處理單元(GPU)和存儲器控制器,所述處理器還包括互連所述處理器核、GPU和存儲器控制器的互連電路;
系統(tǒng)存儲器,所述系統(tǒng)存儲器耦合到所述存儲器控制器;
一個或多個存儲裝置,所述一個或多個存儲裝置具有在其中存儲的包含軟件組件的指令,所述指令配置成在所述處理器核和GPU處理元件上運行,其中在運行時,所述指令使所述系統(tǒng)能夠:
在所述CPU和GPU的每個的可訪問的系統(tǒng)存儲器的共享部分的多個緩沖器中緩沖多個分組;
經(jīng)由所述GPU處理元件上的所述指令的一部分的執(zhí)行,來執(zhí)行使用多個工作組的所述多個分組的并行流分類,每個工作組與工作項的相應(yīng)集合關(guān)聯(lián)并且用來使用批量過程來處理分組的相應(yīng)批量;
對于由批量過程所處理的每個分組,
通過將由所述分組的報頭中的字段所定義的元組與工作項的多個子表之一中的規(guī)則進行匹配,來執(zhí)行使用所述工作項的分組的流分類,其中所述多個子表按照搜索順序來順序搜索;
保持一個或多個命中計數(shù)直方圖,其中每次找到給定子表中的規(guī)則的元組匹配時,使那個子表的所述命中計數(shù)遞增;以及
采用命中計數(shù)直方圖來重新排序一個或多個工作項的所述子表的所述搜索順序。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于英特爾公司,未經(jīng)英特爾公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811465445.1/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 偏振正交雙通道體全息光學數(shù)據(jù)存儲方法及其系統(tǒng)
- 程序代碼的并行性的分析方法和系統(tǒng)
- 用于基于所推斷的工作負載并行性控制中央處理單元功率的系統(tǒng)和方法
- 用于基于溫度動態(tài)地控制多核中央處理單元中的多個核的系統(tǒng)和方法
- 并行異步混合算法處理系統(tǒng)和水庫或水庫群優(yōu)化調(diào)度方法
- 用于動態(tài)控制到便攜式計算裝置的多核心處理器中的多個核心的電力的方法和系統(tǒng)
- 基于SIMD擴展部件的嵌套循環(huán)向量并行的實現(xiàn)方法及其裝置
- 采用集成GPU來加速元組空間搜索的架構(gòu)和機制
- 面向多代碼粒度的向量并行性發(fā)掘方法
- 一種面向FPGA的高并行性光斑分割方法





