[發(fā)明專利]基因序列比對(duì)方法和裝置有效
| 申請(qǐng)?zhí)枺?/td> | 201610826144.1 | 申請(qǐng)日: | 2016-09-18 |
| 公開(公告)號(hào): | CN107844684B | 公開(公告)日: | 2022-02-08 |
| 發(fā)明(設(shè)計(jì))人: | 陳建平;熊軍;支朋超;劉凡 | 申請(qǐng)(專利權(quán))人: | 深圳華大智造科技股份有限公司 |
| 主分類號(hào): | G16B30/10 | 分類號(hào): | G16B30/10;G16B50/00 |
| 代理公司: | 北京清亦華知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11201 | 代理人: | 張大威 |
| 地址: | 518083 廣東省深圳*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基因 序列 方法 裝置 | ||
本發(fā)明提出一種基因序列比對(duì)方法和裝置,該基因序列比對(duì)方法包括獲取待比對(duì)序列中預(yù)設(shè)長(zhǎng)度子序列的索引值;根據(jù)索引值從參考基因序列中讀取對(duì)應(yīng)的比對(duì)序列;判斷待比對(duì)序列和比對(duì)序列是否相同,得到判斷結(jié)果;根據(jù)判斷結(jié)果對(duì)待比對(duì)序列進(jìn)行比對(duì)。通過(guò)本發(fā)明能夠有效提升基因序列比對(duì)效率,提升用戶體驗(yàn)。
技術(shù)領(lǐng)域
本發(fā)明涉及生物信息技術(shù)領(lǐng)域,尤其涉及一種基因序列比對(duì)方法和裝置。
背景技術(shù)
基因序列是包含ACGT四種堿基的長(zhǎng)字符串,例如,人的基因序列有大概30億個(gè)堿基。短基因序列只包含幾十到幾百個(gè)堿基,短基因序列是由基因序列打碎用測(cè)序儀測(cè)量得到的。在基因序列比對(duì)的一些應(yīng)用場(chǎng)景下,需要將短基因序列回帖到參考基因序列中去,找出短基因序列在參考基因序列中的位置,及兩者間差異(例如,測(cè)量誤差以及短基因序列和參考基因序列存在的差異)。
相關(guān)技術(shù)中,通過(guò)高通量測(cè)序序列比對(duì)軟件對(duì)參考基因序列建立預(yù)設(shè)索表引來(lái)提高搜索速度,將參考基因序列中各個(gè)子序列和對(duì)應(yīng)的位置信息存入預(yù)設(shè)索表引,然后提取出相應(yīng)的參考基因序列與短基因序列進(jìn)行比較,篩選差異程度在允許范圍內(nèi)的最佳比對(duì)結(jié)果。由于測(cè)序生成的短基因序列的長(zhǎng)度較早期增加顯著,比對(duì)結(jié)果允許的差異程度較大,包含多個(gè)缺失堿基和插入堿基,現(xiàn)有的比對(duì)軟件,例如,BWA-MEM,BOWTIE2,SOAP3-dp均采用計(jì)算機(jī)指令集加速的動(dòng)態(tài)規(guī)劃匹配算法來(lái)進(jìn)行比對(duì)。
這種方式下,采用計(jì)算機(jī)指令集加速的動(dòng)態(tài)規(guī)劃匹配算法相比傳統(tǒng)的動(dòng)態(tài)規(guī)劃算法,雖然速度有很大的提升,但耗時(shí)較多,基因序列比對(duì)效率較低。
發(fā)明內(nèi)容
本發(fā)明旨在至少在一定程度上解決相關(guān)技術(shù)中的技術(shù)問(wèn)題之一。
為此,本發(fā)明的一個(gè)目的在于提出一種基因序列比對(duì)方法,能夠有效提升基因序列比對(duì)效率,提升用戶體驗(yàn)。
本發(fā)明的另一個(gè)目的在于提出一種基因序列比對(duì)裝置。
為達(dá)到上述目的,本發(fā)明第一方面實(shí)施例提出的基因序列比對(duì)方法,包括:獲取待比對(duì)序列中預(yù)設(shè)長(zhǎng)度子序列的索引值;根據(jù)所述索引值從參考基因序列中讀取對(duì)應(yīng)的比對(duì)序列;判斷所述待比對(duì)序列和所述比對(duì)序列是否相同,得到判斷結(jié)果;根據(jù)所述判斷結(jié)果對(duì)所述待比對(duì)序列進(jìn)行比對(duì)。
本發(fā)明第一方面實(shí)施例提出的基因序列比對(duì)方法,通過(guò)獲取待比對(duì)序列中預(yù)設(shè)長(zhǎng)度子序列的索引值,根據(jù)所述索引值從參考基因序列中讀取對(duì)應(yīng)的比對(duì)序列,判斷所述待比對(duì)序列和所述比對(duì)序列是否相同,得到判斷結(jié)果,根據(jù)所述判斷結(jié)果對(duì)所述待比對(duì)序列進(jìn)行比對(duì),能夠有效提升基因序列比對(duì)效率,提升用戶體驗(yàn)。
為達(dá)到上述目的,本發(fā)明第二方面實(shí)施例提出的基因序列比對(duì)裝置,包括:第一獲取模塊,用于獲取待比對(duì)序列中預(yù)設(shè)長(zhǎng)度子序列的索引值;讀取模塊,用于根據(jù)所述索引值從參考基因序列中讀取對(duì)應(yīng)的比對(duì)序列;判斷模塊,用于判斷所述待比對(duì)序列和所述比對(duì)序列是否相同,得到判斷結(jié)果;對(duì)比模塊,用于根據(jù)所述判斷結(jié)果對(duì)所述待比對(duì)序列進(jìn)行比對(duì)。
本發(fā)明第二方面實(shí)施例提出的基因序列比對(duì)裝置,通過(guò)獲取待比對(duì)序列中預(yù)設(shè)長(zhǎng)度子序列的索引值,根據(jù)所述索引值從參考基因序列中讀取對(duì)應(yīng)的比對(duì)序列,判斷所述待比對(duì)序列和所述比對(duì)序列是否相同,得到判斷結(jié)果,根據(jù)所述判斷結(jié)果對(duì)所述待比對(duì)序列進(jìn)行比對(duì),能夠有效提升基因序列比對(duì)效率,提升用戶體驗(yàn)。
本發(fā)明附加的方面和優(yōu)點(diǎn)將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過(guò)本發(fā)明的實(shí)踐了解到。
附圖說(shuō)明
本發(fā)明上述的和/或附加的方面和優(yōu)點(diǎn)從下面結(jié)合附圖對(duì)實(shí)施例的描述中將變得明顯和容易理解,其中:
圖1是本發(fā)明一實(shí)施例提出的基因序列比對(duì)方法的流程示意圖;
圖2是本發(fā)明另一實(shí)施例提出的基因序列比對(duì)方法的流程示意圖;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳華大智造科技股份有限公司,未經(jīng)深圳華大智造科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610826144.1/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 心腦血管疾病易感基因芯片檢測(cè)試劑盒
- 一組用于頭頸部鱗狀細(xì)胞癌分子分型的基因及其應(yīng)用
- 產(chǎn)β-丙氨酸的重組菌及其構(gòu)建方法與應(yīng)用
- 一種檢測(cè)高血壓藥物代謝相關(guān)基因的引物組和試劑盒
- 一組用于腎細(xì)胞癌分子分型的基因及其應(yīng)用
- 一組用于膀胱癌檢測(cè)的基因及其應(yīng)用
- 一組用于髓母細(xì)胞瘤分子分型的基因及其應(yīng)用
- 一種頭發(fā)相關(guān)的基因位點(diǎn)庫(kù)及其應(yīng)用
- 馬度米星化合物的生物合成基因簇及其應(yīng)用
- 彌漫性大B細(xì)胞淋巴瘤分子分型試劑盒及分型裝置
- 一種數(shù)據(jù)庫(kù)讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





