[發(fā)明專(zhuān)利]利用長(zhǎng)轉(zhuǎn)錄組測(cè)序結(jié)果裝配基因組的方法及裝置有效
| 申請(qǐng)?zhí)枺?/td> | 201210256904.1 | 申請(qǐng)日: | 2012-07-23 |
| 公開(kāi)(公告)號(hào): | CN102789553A | 公開(kāi)(公告)日: | 2012-11-21 |
| 發(fā)明(設(shè)計(jì))人: | 李炯棠;薛尉;汪金兔;祝雅萍;孫效文 | 申請(qǐng)(專(zhuān)利權(quán))人: | 中國(guó)水產(chǎn)科學(xué)研究院 |
| 主分類(lèi)號(hào): | G06F19/20 | 分類(lèi)號(hào): | G06F19/20 |
| 代理公司: | 北京同達(dá)信恒知識(shí)產(chǎn)權(quán)代理有限公司 11291 | 代理人: | 郭紅麗 |
| 地址: | 100141 北京*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 利用 轉(zhuǎn)錄 組測(cè)序 結(jié)果 裝配 基因組 方法 裝置 | ||
1.一種利用長(zhǎng)轉(zhuǎn)錄組測(cè)序結(jié)果裝配基因組的方法,其特征在于,包括以下步驟:
(1)將同一物種的轉(zhuǎn)錄組測(cè)序讀段與基因組片段進(jìn)行比對(duì);
(2)去除僅比對(duì)到1個(gè)基因組片段的轉(zhuǎn)錄組測(cè)序讀段;
(3)針對(duì)(2)中保留下來(lái)的各轉(zhuǎn)錄組測(cè)序讀段,去除相似程度低的轉(zhuǎn)錄組測(cè)序讀段;
(4)針對(duì)(3)中保留下來(lái)的各轉(zhuǎn)錄組測(cè)序讀段,分別在每一個(gè)轉(zhuǎn)錄組測(cè)序讀段上,按照各查詢(xún)區(qū)段的相對(duì)起始位置從小到大依次排列,并根據(jù)該排列順序?qū)Ω鞑樵?xún)區(qū)段由小到大進(jìn)行編號(hào),然后以編號(hào)相對(duì)小的查詢(xún)區(qū)段作為參考區(qū)段,分別將后續(xù)的查詢(xún)區(qū)段與所述參考區(qū)段進(jìn)行比較,保留符合下述兩個(gè)條件中任意一個(gè)條件的后續(xù)的查詢(xún)區(qū)段,去除下述兩個(gè)條件都不符合的后續(xù)查詢(xún)區(qū)段,
ⅰ后續(xù)的查詢(xún)區(qū)段的相對(duì)起始位置與參考區(qū)段的相對(duì)起始位置之差小于等于10,并且后續(xù)的查詢(xún)區(qū)段的相對(duì)終止位置與參考區(qū)段的相對(duì)終止位置的差的絕對(duì)值小于10,
ⅱ后續(xù)的查詢(xún)區(qū)段的相對(duì)終止位置與所述參考區(qū)段的相對(duì)終止位置之差大于等于10,
將保留下來(lái)的后續(xù)查詢(xún)區(qū)段作為新參考區(qū)段,繼續(xù)將該新參考區(qū)段后續(xù)的查詢(xún)區(qū)段與該新參考區(qū)段進(jìn)行比較,保留符合上述條件之一的后續(xù)查詢(xún)區(qū)段,反復(fù)進(jìn)行上述比較,直至該轉(zhuǎn)錄組測(cè)序讀段上最后一個(gè)查詢(xún)區(qū)段作為參考區(qū)段,
對(duì)保留下來(lái)的各查詢(xún)區(qū)段按照上述編號(hào)方法重新進(jìn)行偏號(hào),然后針對(duì)每一轉(zhuǎn)錄組測(cè)序讀段,以編號(hào)相對(duì)小的查詢(xún)區(qū)段作為參考區(qū)段,分別將后續(xù)的查詢(xún)區(qū)段與所述參考區(qū)段進(jìn)行比較,如果后續(xù)的查詢(xún)區(qū)段的相對(duì)起始位置與參考區(qū)段的相對(duì)起始位置之差小于等于10,并且該后續(xù)的查詢(xún)區(qū)段的相對(duì)終止位置和參考區(qū)段的相對(duì)終止位置的差的絕對(duì)值小于10,則去除該后續(xù)的查詢(xún)區(qū)段,而保留不滿(mǎn)足上述條件的后續(xù)查詢(xún)區(qū)段,完成所有比較后,如果存在滿(mǎn)足上述條件的后續(xù)的查詢(xún)區(qū)段,則將該參考區(qū)段也去除,
?接下來(lái),將保留的后續(xù)查詢(xún)區(qū)段作為新參考區(qū)段,繼續(xù)將該新參考區(qū)段后續(xù)的查詢(xún)區(qū)段與該新參考區(qū)段進(jìn)行比較,以相同條件判斷去除或保留該新參考區(qū)段和后續(xù)的查詢(xún)區(qū)段,反復(fù)進(jìn)行上述比較,直至該轉(zhuǎn)錄組測(cè)序讀段上最后一個(gè)查詢(xún)區(qū)段作為參考區(qū)段;
(5)針對(duì)(4)中所保留下來(lái)的所有查詢(xún)區(qū)段按照與(4)相同的編號(hào)方法進(jìn)行編號(hào),然后將每一轉(zhuǎn)錄組測(cè)序讀段中編號(hào)相對(duì)小的查詢(xún)區(qū)段作為起點(diǎn)區(qū)段,將其后續(xù)的所有查詢(xún)區(qū)段分別與其進(jìn)行比較,如果在后續(xù)的查詢(xún)區(qū)段中存在相對(duì)起始位置與該起點(diǎn)區(qū)段的相對(duì)終止位置之差的絕對(duì)值小于30、且絕對(duì)起始位置與該起點(diǎn)區(qū)段的絕對(duì)終止位置之差小于200Kb的查詢(xún)區(qū)段,則將該后續(xù)的查詢(xún)區(qū)段和所述起點(diǎn)區(qū)段的組合作為一個(gè)區(qū)段連接保留下來(lái),并且計(jì)算出這兩個(gè)區(qū)段之間的距離,即該后續(xù)的查詢(xún)區(qū)段的相對(duì)起始位置與所述起點(diǎn)區(qū)段的相對(duì)終止位置的差值,如果在后續(xù)的查詢(xún)區(qū)段中不存在相對(duì)起始位置與起點(diǎn)區(qū)段的相對(duì)終止位置之差的絕對(duì)值小于30、且絕對(duì)起始位置與該起點(diǎn)區(qū)段的絕對(duì)終止位置之差小于200Kb的查詢(xún)區(qū)段,則去除所述起點(diǎn)區(qū)段,然后以該起點(diǎn)區(qū)段后續(xù)的區(qū)段作為新的起點(diǎn)區(qū)段,以同樣條件進(jìn)行與上述相同的比較,以確定與所述新的起點(diǎn)區(qū)段相關(guān)的區(qū)段連接,并且如上所述地計(jì)算出這兩個(gè)區(qū)段之間的距離,如果不存在與所述新的起點(diǎn)區(qū)段相關(guān)的區(qū)段連接,則去除所述新的起點(diǎn)區(qū)段,如此反復(fù)地進(jìn)行比較,直至該轉(zhuǎn)錄組測(cè)序讀段上最后一個(gè)查詢(xún)區(qū)段作為起點(diǎn)區(qū)段,
接下來(lái),針對(duì)每個(gè)查詢(xún)區(qū)段,根據(jù)計(jì)算的兩個(gè)查詢(xún)區(qū)段之間的距離,保留與該查詢(xún)區(qū)段相關(guān)且兩個(gè)區(qū)段之間的距離最小的區(qū)段連接,去除其余與該查詢(xún)區(qū)段相關(guān)的區(qū)段連接;
(6)將(5)中保留下來(lái)的每一個(gè)區(qū)段連接作為與其對(duì)應(yīng)的兩個(gè)基因組片段連接的支持證據(jù);
(7)將(6)中所保留下來(lái)的每個(gè)基因組片段分別作為起始基因組片段,并在與其連接的所有基因組片段中選擇支持證據(jù)最多的基因組片段作為終止片段,形成一個(gè)基因組片段連接關(guān)系;
(8)針對(duì)(7)中每個(gè)只能作為起始基因組片段的基因組片段,分別將其作為起始點(diǎn),從只能連接在其他基因組片段之后作為終止基因組片段的基因組片段,以及既能夠連接在其他基因組片之前作為起始基因組片段,又能夠連接在其他基因組片段之后作為終止基因組片段的基因組片段中,尋找可連接的基因組片段,形成基因組片段連接,將該基因組片段連接作為新的起始點(diǎn),進(jìn)一步如上所述那樣尋找可連接的基因組片段,直至沒(méi)有可連接的基因組片段為止,根據(jù)上述各基因組片段連接的前后順序?qū)⒏骰蚪M片段連接組裝成更長(zhǎng)的基因組片段。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,在步驟(3)中,去除相似程度低于90%的轉(zhuǎn)錄組測(cè)序讀段。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于中國(guó)水產(chǎn)科學(xué)研究院,未經(jīng)中國(guó)水產(chǎn)科學(xué)研究院許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210256904.1/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 上一篇:一種水冷型潤(rùn)滑系統(tǒng)
- 下一篇:一種插銷(xiāo)
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F19-00 專(zhuān)門(mén)適用于特定應(yīng)用的數(shù)字計(jì)算或數(shù)據(jù)處理的設(shè)備或方法
G06F19-10 .生物信息學(xué),即計(jì)算分子生物學(xué)中的遺傳或蛋白質(zhì)相關(guān)的數(shù)據(jù)處理方法或系統(tǒng)
G06F19-12 ..用于系統(tǒng)生物學(xué)的建模或仿真,例如:概率模型或動(dòng)態(tài)模型,遺傳基因管理網(wǎng)絡(luò),蛋白質(zhì)交互作用網(wǎng)絡(luò)或新陳代謝作用網(wǎng)絡(luò)
G06F19-14 ..用于發(fā)展或進(jìn)化的,例如:進(jìn)化的保存區(qū)域決定或進(jìn)化樹(shù)結(jié)構(gòu)
G06F19-16 ..用于分子結(jié)構(gòu)的,例如:結(jié)構(gòu)排序,結(jié)構(gòu)或功能關(guān)系,蛋白質(zhì)折疊,結(jié)構(gòu)域拓?fù)洌媒Y(jié)構(gòu)數(shù)據(jù)的藥靶,涉及二維或三維結(jié)構(gòu)的
G06F19-18 ..用于功能性基因組學(xué)或蛋白質(zhì)組學(xué)的,例如:基因型–表型關(guān)聯(lián),不均衡連接,種群遺傳學(xué),結(jié)合位置鑒定,變異發(fā)生,基因型或染色體組的注釋?zhuān)鞍踪|(zhì)相互作用或蛋白質(zhì)核酸的相互作用
- 磁轉(zhuǎn)錄方法及磁轉(zhuǎn)錄裝置
- 媒體轉(zhuǎn)錄控制方法及使用上述方法的嵌入式系統(tǒng)
- 使用轉(zhuǎn)錄門(mén)戶(hù)組件隨需轉(zhuǎn)錄語(yǔ)音的方法和系統(tǒng)
- 應(yīng)用順式作用核酶對(duì)轉(zhuǎn)錄進(jìn)行調(diào)節(jié)
- 用于基因治療的載體
- 簡(jiǎn)化聽(tīng)寫(xiě)式語(yǔ)音文本系統(tǒng)的轉(zhuǎn)錄的復(fù)制粘貼的方法和系統(tǒng)
- 一種RNA反轉(zhuǎn)錄擴(kuò)增方法
- 基于人工智能的跨語(yǔ)種語(yǔ)音轉(zhuǎn)錄方法、設(shè)備及可讀介質(zhì)
- 一種mRNA的制備方法及其在腫瘤治療中的應(yīng)用
- 前列腺癌細(xì)胞LNCaP的FASN基因長(zhǎng)短不同轉(zhuǎn)錄本的獲取及定量方法
- 一種兩核苷酸實(shí)時(shí)合成DNA解碼測(cè)序方法
- 一種基因組重測(cè)序分析系統(tǒng)及方法
- 基于轉(zhuǎn)錄組雙端測(cè)序數(shù)據(jù)組裝基因組序列的方法和裝置
- 一種3’端可逆封閉的兩核苷酸實(shí)時(shí)合成測(cè)序方法
- 用于微生物多樣性研究的引物組、接頭組和測(cè)序方法
- 一種轉(zhuǎn)錄組測(cè)序和蛋白組學(xué)測(cè)序數(shù)據(jù)的貫穿分析方法及系統(tǒng)
- 全基因組重測(cè)序分析及用于全基因組重測(cè)序分析的方法
- 菌株基因組注釋查詢(xún)方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 空間組學(xué)測(cè)序、單細(xì)胞表觀轉(zhuǎn)錄組學(xué)測(cè)序及定位標(biāo)識(shí)方法
- 一種宏轉(zhuǎn)錄組測(cè)序數(shù)據(jù)處理方法及系統(tǒng)





