[發(fā)明專(zhuān)利]一種針對(duì)成對(duì)隱馬爾可夫模型的加速方法、系統(tǒng)及裝置有效
| 申請(qǐng)?zhí)枺?/td> | 202110635447.6 | 申請(qǐng)日: | 2021-06-07 |
| 公開(kāi)(公告)號(hào): | CN113268270B | 公開(kāi)(公告)日: | 2022-10-21 |
| 發(fā)明(設(shè)計(jì))人: | 譚光明;李葉文;高睿昊;臧大偉;劉萬(wàn)奇;康寧 | 申請(qǐng)(專(zhuān)利權(quán))人: | 中科計(jì)算技術(shù)西部研究院 |
| 主分類(lèi)號(hào): | G06F9/30 | 分類(lèi)號(hào): | G06F9/30;G16B30/00 |
| 代理公司: | 重慶強(qiáng)大凱創(chuàng)專(zhuān)利代理事務(wù)所(普通合伙) 50217 | 代理人: | 黃書(shū)凱 |
| 地址: | 401120 重*** | 國(guó)省代碼: | 重慶;50 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 針對(duì) 成對(duì) 隱馬爾可夫 模型 加速 方法 系統(tǒng) 裝置 | ||
本發(fā)明涉及基因分析技術(shù)領(lǐng)域,具體為一種針對(duì)成對(duì)隱馬爾可夫模型的加速方法、系統(tǒng)及裝置,裝置包括:通用計(jì)算模塊,用于拆分出成對(duì)隱馬爾可夫模型的指令集中的特定指令,將特定指令發(fā)送給交互接口,并執(zhí)行剩余內(nèi)容;交互接口,用于傳輸特定指令,并對(duì)特定指令進(jìn)行解碼,將其轉(zhuǎn)化為加速器陣列模塊所需的信息;加速器陣列模塊,用于指令并行接收,并根據(jù)所需的信息執(zhí)行對(duì)成對(duì)隱馬爾可夫模型的加速。本方案能計(jì)算匹配特征,降低交互損耗,提高計(jì)算效率。
技術(shù)領(lǐng)域
本發(fā)明涉及基因分析技術(shù)領(lǐng)域,具體為一種針對(duì)成對(duì)隱馬爾可夫模型的加速方法、系統(tǒng)及裝置。
背景技術(shù)
基因分析技術(shù)作為探索生命奧秘的重要手段,正成為生物信息學(xué)研究的重要分支,在物種鑒別、基因檢測(cè)、疾病診斷等方面都有著廣泛的應(yīng)用。基因分析技術(shù)的飛速發(fā)展為精準(zhǔn)醫(yī)療奠定了堅(jiān)實(shí)的基礎(chǔ),也使得臨床診斷前景更加光明。近年來(lái),隨著第二代測(cè)序技術(shù)的高速發(fā)展,測(cè)序成本的下降速率已經(jīng)遠(yuǎn)遠(yuǎn)超過(guò)摩爾定律的下降速率,因此基因數(shù)據(jù)量也呈爆炸式增長(zhǎng),呈爆炸式增長(zhǎng)的基因數(shù)據(jù)量對(duì)現(xiàn)有處理器的處理能力提出了新的挑戰(zhàn)。成對(duì)隱馬爾可夫模型(Pair-Hidden Markov Model,Pair-HMM)作為基因分析流程中必不可少且相當(dāng)耗時(shí)的一個(gè)步驟,在基因分析的變異體檢測(cè)流程中占據(jù)了大約70%的執(zhí)行時(shí)間。成對(duì)隱馬爾可夫模型的執(zhí)行效率已經(jīng)成為目前基因分析流程一個(gè)重要的性能瓶頸,在基因分析加速研究中占據(jù)著十分重要的地位。
現(xiàn)有的成對(duì)隱馬爾可夫模型的實(shí)現(xiàn)和加速技術(shù)大致分為:面向CPU的并行加速、面向GPGPU(General-Purpose Computing on Graphics Processing Units,通用圖形處理器)的異構(gòu)加速、基于FPGA(Field Programmable Gate Array,現(xiàn)場(chǎng)可編程邏輯門(mén)陣列)的定制加速和基于ASIC(Application-Specific Integrated Circuit,專(zhuān)用集成電路)的定制加速四類(lèi):
1)CPU并行加速作為最常見(jiàn)的加速方法,特點(diǎn)是有成熟的編程工具支持,能夠快速地實(shí)現(xiàn)。目前基因分析所使用的工具,如GATK、GKL均是這方面的成果。但是,基因數(shù)據(jù)分析的計(jì)算模式與傳統(tǒng)CPU計(jì)算架構(gòu)不匹配,在控制模式上,CPU依賴(lài)指令驅(qū)動(dòng)的細(xì)粒度控制模式,但是基因分析流程為數(shù)據(jù)驅(qū)動(dòng)的粗粒度控制模式;在數(shù)據(jù)模式上,CPU依賴(lài)數(shù)據(jù)的局部性來(lái)做分支預(yù)測(cè)等操作,這在隨機(jī)訪存的基因分析流程上并不適用;在并發(fā)模式上,CPU依賴(lài)多核提供了有限的并行度,但是在基因分析流程中常常需要提供和讀對(duì)數(shù)量相當(dāng)?shù)牟⑿卸取?/p>
2)相對(duì)于CPU并行加速,GPGPU異構(gòu)加速龐大的計(jì)算單元量解決了并行度的問(wèn)題,但是GPGPU仍存在依靠細(xì)粒度的指令控制和依賴(lài)數(shù)據(jù)的局部性等問(wèn)題。
3)FPGA定制加速通過(guò)定制相應(yīng)的計(jì)算和控制邏輯,來(lái)實(shí)現(xiàn)和基因分析流程計(jì)算結(jié)構(gòu)和計(jì)算特征上的匹配,但是基于LUT(Lookup Table,顯示查找表)實(shí)現(xiàn)的定制邏輯,存在主頻低和能效低等方面的問(wèn)題,其相對(duì)于高主頻的CPU并行加速和GPGPU異構(gòu)加速往往無(wú)法取得良好的加速效果。
4)相對(duì)于上述三種技術(shù),ASIC定制加速雖然可以做到計(jì)算結(jié)構(gòu)和計(jì)算特征的匹配及高主頻,但是PCIe(Peripheral Component Interconnect Express,高速串行計(jì)算機(jī)擴(kuò)展總線標(biāo)準(zhǔn))和SerDes(SERializer/DESerializer,串行器/解串器)等總線帶寬遠(yuǎn)低于訪存設(shè)備的帶寬,使獨(dú)立加速器和通用處理器之間交互損耗較高。
綜上所述,ASIC定制加速相對(duì)于前三種加速技術(shù)優(yōu)點(diǎn)更多,但是其也存在交互損耗較高的問(wèn)題,因此現(xiàn)階段基因分析中的成對(duì)隱馬爾可夫模型急需一種能降低交互損耗的新型加速技術(shù)。
發(fā)明內(nèi)容
本發(fā)明意在提供一種針對(duì)成對(duì)隱馬爾可夫模型的加速方法、系統(tǒng)及裝置,能夠降低交互損耗。
本發(fā)明提供基礎(chǔ)方案一:針對(duì)成對(duì)隱馬爾可夫模型的加速裝置,包括:通用計(jì)算模塊、交互接口和加速器陣列模塊;
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于中科計(jì)算技術(shù)西部研究院,未經(jīng)中科計(jì)算技術(shù)西部研究院許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110635447.6/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
- 認(rèn)知無(wú)線電系統(tǒng)中基于隱馬爾可夫模型的頻譜接入方法
- 一種基于隱馬爾可夫模型的人臉識(shí)別方法
- 基于隱馬爾可夫模型的英文簡(jiǎn)歷關(guān)鍵字段抽取方法
- 基于遺傳算法的隱馬爾科夫模型在主機(jī)風(fēng)險(xiǎn)評(píng)估中的應(yīng)用
- 用于推薦系統(tǒng)的數(shù)據(jù)處理方法、數(shù)據(jù)處理裝置和電子設(shè)備
- SDN數(shù)據(jù)中心基于隱馬爾可夫模型的多徑路由選徑方法
- 基于高斯混合的因子隱馬爾可夫負(fù)荷分解方法
- 一種外骨骼步態(tài)辨識(shí)方法和裝置
- 隱馬爾可夫模型在地圖匹配中的優(yōu)化方法及GPS定位方法
- 基于隱馬爾可夫模型的Costas信號(hào)解碼方法、系統(tǒng)及存儲(chǔ)介質(zhì)





