[發明專利]基于CPU+GPU異構的高并發序列比對計算加速方法有效
| 申請號: | 202210046617.1 | 申請日: | 2022-01-17 |
| 公開(公告)號: | CN114064551B | 公開(公告)日: | 2022-05-17 |
| 發明(設計)人: | 張巍;林超寧;張崇 | 申請(專利權)人: | 廣州嘉檢醫學檢測有限公司 |
| 主分類號: | G06F15/16 | 分類號: | G06F15/16;G06F9/48 |
| 代理公司: | 廣州君策達知識產權代理事務所(普通合伙) 44749 | 代理人: | 陳宏升 |
| 地址: | 510000 廣東省廣州市黃埔區*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 cpu gpu 并發 序列 計算 加速 方法 | ||
1.基于CPU+GPU異構的高并發序列比對計算加速方法,其特征在于,包含以下步驟:
BWA-MEM算法代碼重構步驟:對于BWA-MEM算法,簡化其數據結構并優化部分循環及邏輯判斷語句,使其適合在GPU架構上運行;
CPU上任務并發處理步驟:在CPU上,對于待比對的序列集,首先根據GPU的處理線程數來設定序列的數據塊大小,完成序列集的劃分,第一次形成多個并發任務;然后CPU數據線程分塊讀取序列數據,接著進行序列數據對比;
GPU上數據并發處理步驟:在GPU上,運行代碼重構后的BWA-MEM算法,用以完成序列數據對比的數據并發;
GPU上任務并發處理步驟:在GPU上,對于序列數據對比的數據并發處理過程中產生的種子集和鏈,將相同或相鄰的長度、位置、數量的種子集劃分為同一數據塊,鏈做同樣處理,由此完成種子集與鏈的劃分,第二次形成多個并發任務;
所述序列數據對比是通過開啟兩個調度線程以流水線形式來處理的:初始化一個主機線程等待,另一個主機線程分步驟一、二進行工作;當工作的主機線程進行到步驟二時,等待線程激活,等待的主機線程開始處理步驟一;
所述步驟一為:獲取內存數據后,調度GPU進行找種子、擴展任務,并把GPU計算得到的種子的擴展得分集作為中間數據從GPU內存拷貝到主機內存;
所述步驟二為:生成sam數據并輸出文件;
代碼重構后的BWA-MEM算法是通過全局工作列表來支持其異步執行, GPU為每個序列比對分析任務分配一個本地工作列表,并發比對分析任務共用一個遠程工作列表;在系統運行期間,GPU周期性地報告產生和消耗的工作項;一旦工作項的總數為零,處理終止;GPU中包含三個線程:接收線程、發送線程和工作線程,前兩個線程用于GPU 之間的通信,最后一個線程用于本地工作項的處理;每個GPU接收到來自上一個設備的遠程工作項,交給接收線程來完成工作項的分流;工作線程和接收線程都會提交GPU kernel來完成它們的工作,接收線程的kernel提交到獨立的流上,并被分配更高的優先級;
所述加速方法以數據流水線傳輸的方式實現高效的異步通信:在多GPU節點中,CPU和GPU之間通過前端總線相連接;前端總線連接到連接器上以支持CPU-GPU、GPU-GPU之間的通信; GPU1和GPU2、GPU3和GPU4之間可以直接數據傳輸,GPU2和GPU3之間的數據傳輸要經過CPU,因此分為兩個階段:GPU2先發送數據到主存,然后GPU3 再從主存中拉取信息;GPU包含輸入、輸出兩個內存拷貝引擎,以及一個執行引擎,因此支持兩路內存拷貝和代碼執行并發進行;序列比對算法執行過程中,在GPU的接收端設計多個接收Buffer,實現了流水線的接收器;一段數據傳輸完成后,GPU對其進行處理的同時可以立刻開始下一段數據的傳輸;異步程序通過細粒度同步點來保證正確性;所采用的異步通信機制為 future/promise 機制或者event 機制。
2.根據權利要求1所述基于CPU+GPU異構的高并發序列比對計算加速方法,其特征在于,簡化BWA-MEM算法的數據結構,是指使用CUDA語言對數據結構進行了重構,去掉數據結構中的復雜結構,所述復雜結構包括多級指針、結構體。
3.根據權利要求1所述基于CPU+GPU異構的高并發序列比對計算加速方法,其特征在于,優化BWA-MEM算法的部分循環及邏輯判斷語句,是指對部分循環進行等效展開,對邏輯判斷語句進行重構。
4.根據權利要求1所述基于CPU+GPU異構的高并發序列比對計算加速方法,其特征在于,所述多個并發任務所對應形成數據劃分塊,通過數據調度器及設定的調度規則將最需要訪問的數據劃分塊優先載入緩存中。
5.根據權利要求1所述基于CPU+GPU異構的高并發序列比對計算加速方法,其特征在于,所述序列數據包括單端或雙端DNA測序片段數據。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州嘉檢醫學檢測有限公司,未經廣州嘉檢醫學檢測有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210046617.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種寬帶細步進頻率合成電路及方法
- 下一篇:一種雙面膠粘性力測試裝置





