[發(fā)明專利]一種快速檢測融合基因的方法在審
| 申請?zhí)枺?/td> | 201710293318.7 | 申請日: | 2017-04-28 |
| 公開(公告)號: | CN107437002A | 公開(公告)日: | 2017-12-05 |
| 發(fā)明(設(shè)計)人: | 閆成海;唐元華;徐健 | 申請(專利權(quán))人: | 首度生物科技(蘇州)有限公司;蘇州首度基因科技有限責(zé)任公司 |
| 主分類號: | G06F19/22 | 分類號: | G06F19/22 |
| 代理公司: | 北京恒泰銘睿知識產(chǎn)權(quán)代理有限公司11642 | 代理人: | 胡艷 |
| 地址: | 215123 江蘇省蘇州市蘇州*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 快速 檢測 融合 基因 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及生物信息技術(shù)領(lǐng)域,尤其是一種快速檢測融合基因的方法。
背景技術(shù)
融合基因是指兩個基因的全部或者部分序列相互融合為一個全新的基因的過程,其有可能是染色體易位、中間缺失或染色體倒置所致的結(jié)果,通常具有致瘤性。1973年,芝加哥大學(xué)的Janet Rowley確認(rèn)了費城染色體的形成機制來自于染色體易位,并在白血病中發(fā)現(xiàn)第一個融合基因。隨后,在眾多實體瘤如尤文肉瘤、滑膜肉瘤、前列腺癌、肺癌、乳腺癌、卵巢癌等中相繼發(fā)現(xiàn)了融合基因的存在。據(jù)相關(guān)研究報道,90%以上的慢性粒細(xì)胞白血病(CML)會出現(xiàn)BCR-ABL融合基因,此基因產(chǎn)生一種新的mRNA,編碼的蛋白為P210,P210會使細(xì)胞失去對周圍環(huán)境的反應(yīng)性,并抑制細(xì)胞凋亡的發(fā)生。因此,BCR-ABL融合基因也可以作為慢性粒細(xì)胞白血病的生物標(biāo)記,來判別是否罹患慢性粒細(xì)胞白血病。常見的基因融合原理如圖1所示,第一個基因從第二個序列斷開,第二個基因從第二個序列斷開,第一個基因的前段和第二個基因的后段組合形成新的基因。
目前融合基因的檢測,多是基于高通量測序技術(shù),首先進(jìn)行轉(zhuǎn)錄組測序,獲得全部轉(zhuǎn)錄本的序列信息;然后將這些序列回帖到人類基因組上,尋找可以比對上不同區(qū)域上的嵌合序列,對于雙端測序,可以尋找橫跨某一區(qū)域的雙端序列,。最后根據(jù)嵌合序列比對到的基因,確定融合基因的名稱。
然而,由于現(xiàn)有測序技術(shù)具有一定的錯誤率,加之人類基因組的復(fù)雜性,現(xiàn)有融合基因的檢測裝置和方法并不能很好的完成檢測目標(biāo)。現(xiàn)有檢測方法存在以下不足:
1.檢測過程對短序列比對軟件的依賴較高,比對結(jié)果的好壞對檢測到融合基因的有較大影響;
2.檢測時間相對較長、內(nèi)存消耗較大。現(xiàn)有檢測方法一般要花費數(shù)小時或者數(shù)天來才能檢測到結(jié)果,且對計算內(nèi)存消耗較大,一般的計算設(shè)備較難滿足要求。
3.檢測結(jié)果的假陽性較高。由于測序錯誤、比對錯誤等原因,傳統(tǒng)的檢測方法會產(chǎn)生較多的假陽性結(jié)果,導(dǎo)致分析結(jié)果需要進(jìn)一步驗證才能最終確定真正的融合基因。
發(fā)明內(nèi)容
為了解決上述技術(shù)問題,本發(fā)明提供了一種快速檢測融合基因的方法,其不但可以快速檢測出融合基因,同時可以防止軟件比對錯誤引起的誤判。
一種快速檢測融合基因的方法,包括以下步驟:
A.建立融合基因數(shù)據(jù)庫:將已知的融合基因斷裂點以及斷裂點前面的N個序列和斷裂點后面的M個序列組成種子,種子的集合形成融合基因數(shù)據(jù)庫;
B.獲取待檢測基因:通過基因檢測裝置,獲取待檢測基因的序列數(shù)據(jù);
D.將種子與待檢測基因的序列數(shù)據(jù)比對,確定待檢測基因的序列數(shù)據(jù)是否包含種子信息;
E.當(dāng)包含待檢測基因包含種子信息時,則認(rèn)為待檢測基因內(nèi)含有融合基因;否則認(rèn)為不包含融合基因。
進(jìn)一步地,在所述步驟B之后還包括步驟C.將序列數(shù)據(jù)建立數(shù)據(jù)庫索引。
進(jìn)一步地,在所述步驟D之后還包括步驟F.當(dāng)含有融合基因時,判斷待檢測基因包含融合基因的含量,當(dāng)融合基因的含量大于一定閾值時,提示存在風(fēng)險。
進(jìn)一步地,所述步驟B中的基因檢測裝置為二代高通量測序平臺或三代測序平臺或基因芯片。
進(jìn)一步地,所述步驟A中,N≥5或M≥5。
進(jìn)一步地,所述步驟D中種子與序列數(shù)據(jù)采用局部比對。
采用上述方法,本發(fā)明具有以下的技術(shù)效果:
1.由于本發(fā)明將將已知的融合基因斷裂點以及斷裂點前面的N個序列和斷裂點后面的M個序列組成種子,種子的集合形成融合基因數(shù)據(jù)庫,并將種子與待檢測基因的序列數(shù)據(jù)進(jìn)行比對,棄用了常規(guī)的融合基因?qū)ふ曳椒ǎㄟ^建立新的融合基因數(shù)據(jù)庫,采用執(zhí)果索因的方式,不需要與人類基因組進(jìn)行比較,避免了既耗時又可能產(chǎn)生錯誤的比對基因組步驟,使得此種方法檢測速度可提高幾十倍,很少的內(nèi)存需求下完成分析,并且防止了比較錯誤引起的誤判。
2.當(dāng)融合基因大于閾值時,提示存在風(fēng)險,通過本發(fā)明的檢測融合基因的方法,可以有效檢測融合基因并且提示用戶注意,提前做出預(yù)防。
3.基因檢測裝置為二代高通量測序平臺或三代測序平臺或基因芯片,通過快速測序平臺,使得檢測融合基因的方法的檢測速度進(jìn)一步提高,防止測序的時間影響整個檢測時間。
4.N≥5或M≥5時,種子與待檢測基因的序列數(shù)據(jù)比對速度較快,并且可以有效保障準(zhǔn)確率,如果N<5,則可能引起誤判;同樣M<5,也有可能引起誤判。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于首度生物科技(蘇州)有限公司;蘇州首度基因科技有限責(zé)任公司,未經(jīng)首度生物科技(蘇州)有限公司;蘇州首度基因科技有限責(zé)任公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710293318.7/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F19-00 專門適用于特定應(yīng)用的數(shù)字計算或數(shù)據(jù)處理的設(shè)備或方法
G06F19-10 .生物信息學(xué),即計算分子生物學(xué)中的遺傳或蛋白質(zhì)相關(guān)的數(shù)據(jù)處理方法或系統(tǒng)
G06F19-12 ..用于系統(tǒng)生物學(xué)的建模或仿真,例如:概率模型或動態(tài)模型,遺傳基因管理網(wǎng)絡(luò),蛋白質(zhì)交互作用網(wǎng)絡(luò)或新陳代謝作用網(wǎng)絡(luò)
G06F19-14 ..用于發(fā)展或進(jìn)化的,例如:進(jìn)化的保存區(qū)域決定或進(jìn)化樹結(jié)構(gòu)
G06F19-16 ..用于分子結(jié)構(gòu)的,例如:結(jié)構(gòu)排序,結(jié)構(gòu)或功能關(guān)系,蛋白質(zhì)折疊,結(jié)構(gòu)域拓?fù)洌媒Y(jié)構(gòu)數(shù)據(jù)的藥靶,涉及二維或三維結(jié)構(gòu)的
G06F19-18 ..用于功能性基因組學(xué)或蛋白質(zhì)組學(xué)的,例如:基因型–表型關(guān)聯(lián),不均衡連接,種群遺傳學(xué),結(jié)合位置鑒定,變異發(fā)生,基因型或染色體組的注釋,蛋白質(zhì)相互作用或蛋白質(zhì)核酸的相互作用





