[發(fā)明專利]一種基于序列比對(duì)的分析DNA突變類型的方法有效
| 申請(qǐng)?zhí)枺?/td> | 201810264214.8 | 申請(qǐng)日: | 2018-03-28 |
| 公開(公告)號(hào): | CN108573128B | 公開(公告)日: | 2020-08-07 |
| 發(fā)明(設(shè)計(jì))人: | 高瑞;趙宇晴 | 申請(qǐng)(專利權(quán))人: | 山東大學(xué) |
| 主分類號(hào): | G16B20/20 | 分類號(hào): | G16B20/20 |
| 代理公司: | 濟(jì)南圣達(dá)知識(shí)產(chǎn)權(quán)代理有限公司 37221 | 代理人: | 王志坤 |
| 地址: | 250061 山東*** | 國省代碼: | 山東;37 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 序列 分析 dna 突變 類型 方法 | ||
本發(fā)明公開了一種基因表達(dá)中一類遺傳變異算法分析突變類型的基于計(jì)算機(jī)的方法,在計(jì)算機(jī)中輸入野生型DNA1序列和突變型DNA2序列,通過算法直接可以詳細(xì)輸出了突變類型,發(fā)生突變的位置,和堿基變化情況,最后,仿真結(jié)果驗(yàn)證了該算法的有效性,該遺傳變異算法具有準(zhǔn)確,高效,省時(shí),省力的優(yōu)點(diǎn),而且其結(jié)果明確,每個(gè)變異基因都有清晰的顯示。
技術(shù)領(lǐng)域
本發(fā)明屬于遺傳變異算法技術(shù)領(lǐng)域,具體涉及基因表達(dá)中一類遺傳變異算法。
背景技術(shù)
生物學(xué)正處于像其他大多數(shù)科學(xué)領(lǐng)域一樣的數(shù)據(jù)雪崩時(shí)代。“大數(shù)據(jù)”一詞起源于互聯(lián)網(wǎng)和IT行業(yè),但隨著人類基因組計(jì)劃的完成,生物技術(shù)產(chǎn)業(yè)的一場(chǎng)革命導(dǎo)致了高通量測(cè)序技術(shù)的快速發(fā)展,使生命科學(xué)研究獲得了強(qiáng)大的數(shù)據(jù)輸出能力,包括基因組學(xué)、轉(zhuǎn)錄組學(xué)、蛋白質(zhì)組學(xué)、代謝組學(xué)等生物數(shù)據(jù)。大數(shù)據(jù)具有以下特點(diǎn):大量、多樣、高速、低價(jià)值密度和真實(shí)性。一個(gè)新的領(lǐng)域生物信息學(xué)應(yīng)運(yùn)而生,以滿足對(duì)于分析和處理近期涌現(xiàn)的大數(shù)據(jù)的需求。
生物信息學(xué)作為一門新興的,發(fā)展迅速的交叉學(xué)科,在過去十年中有著爆炸性的成長。自20世紀(jì)80年代末以來,生物信息學(xué)這一術(shù)語普遍用于遺傳數(shù)據(jù)的比較分析算法中。生物信息學(xué)分析主要致力于分子生物學(xué)中的三大數(shù)據(jù)集:基因組序列、大分子結(jié)構(gòu)和功能基因組學(xué)實(shí)驗(yàn)結(jié)果(如表達(dá)數(shù)據(jù))。其中,序列比對(duì)具有重要意義,從信息科學(xué)角度看,序列比對(duì)從嚴(yán)格意義上講屬于同源分析,同源性分析對(duì)生命起源、進(jìn)化樹構(gòu)建、腫瘤學(xué)、精準(zhǔn)醫(yī)學(xué)等領(lǐng)域的研究有著重要的影響。序列比對(duì)算法是在計(jì)算機(jī)輔助下生物信息學(xué)研究的關(guān)鍵方法。成對(duì)序列比對(duì)方法通常用來尋找兩個(gè)給定序列的局部比對(duì)或全局比對(duì)。為了產(chǎn)生兩兩比對(duì),有三種基本方法:點(diǎn)矩陣法、動(dòng)態(tài)規(guī)劃法和詞方法。點(diǎn)矩陣法生成一個(gè)單一序列區(qū)域的對(duì)齊序列,盡管在概念上簡單易懂,但是當(dāng)大規(guī)模分析時(shí)及其耗時(shí)。動(dòng)態(tài)規(guī)劃算法在成對(duì)比對(duì)中是應(yīng)用最廣泛的算法,但對(duì)于長序列或大量序列來說,速度較慢。GA,PSO,ACO,GSA等各種軟計(jì)算算法在近幾年都有發(fā)展趨勢(shì),詞方法也被稱為k-詞法,它是一種啟發(fā)式的算法,不能保證找到最佳的對(duì)齊方案,但顯然比動(dòng)態(tài)規(guī)劃算法更有效率。雖然以上提到的算法都有各自的優(yōu)缺點(diǎn),但是對(duì)于精確到堿基變化的突變類型分析還沒有實(shí)現(xiàn),此外,當(dāng)海量數(shù)據(jù)到時(shí),特定基因突變類型的判定也一直是一個(gè)問題,因此,亟待提供一種精確有效的算法來區(qū)分特定基因突變類型的功能,同時(shí)為以后大量數(shù)據(jù)的處理提供基礎(chǔ)。
發(fā)明內(nèi)容
針對(duì)現(xiàn)有技術(shù)中存在的不足,本文的目的在于提出了一種基因表達(dá)中一類遺傳變異算法,該遺傳變異算法實(shí)現(xiàn)了區(qū)分特定基因突變類型的功能,且這里的算法與其他算法不同,具有非常詳細(xì)的輸出,即根據(jù)突變的規(guī)律,對(duì)于輸入的DNA序列對(duì),該算法基于計(jì)算機(jī)輸出了突變類型,發(fā)生突變的位置,和具體的堿基突變情況。最后,仿真結(jié)果驗(yàn)證了該算法的有效性,該遺傳變異算法具有準(zhǔn)確,高效,省時(shí),省力的優(yōu)點(diǎn),而且其結(jié)果明確,每個(gè)變異基因都有清晰的顯示。
為了實(shí)現(xiàn)上述目的,本發(fā)明提供了一種基于序列比對(duì)的分析DNA突變類型的方法,包括以下步驟:
步驟1:在所述計(jì)算機(jī)中輸入野生型DNA1和突變型DNA2序列;
步驟2:比對(duì)野生型DNA1和突變型DNA2序列,確定第一個(gè)不同的突變堿基i,并比對(duì)i后三位堿基i+1、i+2和i+3是否相同,若DNA1和DNA2中i+1~i+3三位堿基比對(duì)相同轉(zhuǎn)步驟3;若不同則轉(zhuǎn)步驟4;
步驟3:判斷突變堿基i是否導(dǎo)致終止密碼子的形成,是則判斷突變類型為無意義突變,計(jì)算機(jī)輸出結(jié)果,結(jié)束;否則判斷為錯(cuò)義突變,計(jì)算機(jī)輸出結(jié)果,結(jié)束;
步驟4:在堿基i的基礎(chǔ)上滑動(dòng)N個(gè)堿基,其中N≥1,直到發(fā)現(xiàn)DNA1和DNA2中i+1~i+3三位堿基比對(duì)相同,則滑動(dòng)停止,進(jìn)入步驟5;
步驟5:根據(jù)步驟4滑動(dòng)的堿基個(gè)數(shù)N進(jìn)行判斷,若滑動(dòng)堿基個(gè)數(shù)N=1,則判斷突變類型為插入突變和缺失突變,計(jì)算機(jī)輸出結(jié)果,結(jié)束;若滑動(dòng)堿基個(gè)數(shù)N≠1則進(jìn)行步驟6;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于山東大學(xué),未經(jīng)山東大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810264214.8/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 核酸外切酶保護(hù)DNA探針雜交DNA微陣列芯片檢測(cè)DNA結(jié)合蛋白
- DNA的合成方法
- 一種基因組DNA提取方法
- 用于產(chǎn)生由單分子DNA形成的環(huán)狀DNA的方法
- 在DNA分子的環(huán)化中僅選擇由單分子形成的環(huán)化DNA的方法
- 基于靶標(biāo)蛋白誘導(dǎo)DNA酶循環(huán)生成的均相免疫分析方法
- 一種測(cè)序用DNA文庫
- 一種無立足點(diǎn)和分支遷移域的DNA鏈置換新方法
- 一種DNA功能化納米金探針及其檢測(cè)端粒酶的應(yīng)用
- 一種不產(chǎn)生DNA雙鏈斷裂的實(shí)現(xiàn)植物基因替換的方法





