[發(fā)明專利]一種DNA甲基化測序數(shù)據(jù)計算解讀方法有效
| 申請?zhí)枺?/td> | 201710362178.4 | 申請日: | 2017-05-22 |
| 公開(公告)號: | CN107273663B | 公開(公告)日: | 2018-12-11 |
| 發(fā)明(設(shè)計)人: | 宋卓;劉蓬俠;李根 | 申請(專利權(quán))人: | 人和未來生物科技(長沙)有限公司 |
| 主分類號: | G06F19/20 | 分類號: | G06F19/20 |
| 代理公司: | 湖南兆弘專利事務(wù)所(普通合伙) 43008 | 代理人: | 譚武藝 |
| 地址: | 410152 湖南省長沙*** | 國省代碼: | 湖南;43 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 dna 甲基化 序數(shù) 計算 解讀 方法 | ||
1.一種DNA甲基化測序數(shù)據(jù)計算解讀方法,其特征在于實(shí)施步驟包括:
1)對用于DNA甲基化測序的參考基因組數(shù)據(jù)和原始的測序樣本數(shù)據(jù)進(jìn)行預(yù)處理;
2)通過CPU調(diào)用FPGA上硬件實(shí)現(xiàn)的比對器將預(yù)處理后的測序樣本數(shù)據(jù)和參考基因組進(jìn)行比對;
3)通過CPU調(diào)用GPU上編程實(shí)現(xiàn)的識別器、FPGA上硬件實(shí)現(xiàn)的深度學(xué)習(xí)模型基于比對結(jié)果進(jìn)行甲基化識別;
4)對結(jié)果數(shù)據(jù)進(jìn)行可視化,通過CPU調(diào)用FPGA上硬件實(shí)現(xiàn)的深度學(xué)習(xí)模型對結(jié)果數(shù)據(jù)反映的甲基化功能進(jìn)行挖掘和分析,且CPU調(diào)用GPU上編程處理分析挖掘相關(guān)的視頻、動畫和顯示任務(wù),CPU調(diào)用DSP上編程處理和分析挖掘相關(guān)的圖形、圖像和音頻任務(wù);
步驟1)對參考基因組數(shù)據(jù)進(jìn)行預(yù)處理的詳細(xì)步驟包括:對參考基因組數(shù)據(jù)進(jìn)行針對甲基化的生信轉(zhuǎn)換,通過CPU調(diào)用FPGA上硬件實(shí)現(xiàn)的索引生成器為生信轉(zhuǎn)換后的參考基因組數(shù)據(jù)生成用于后續(xù)比對任務(wù)的索引,輸出生信轉(zhuǎn)換后的參考基因組數(shù)據(jù)及其索引;
步驟1)對原始的測序樣本數(shù)據(jù)進(jìn)行預(yù)處理的詳細(xì)步驟包括:對原始的測序樣本數(shù)據(jù)進(jìn)行數(shù)據(jù)質(zhì)量控制得到可靠樣本數(shù)據(jù),所述數(shù)據(jù)質(zhì)量控制包括修剪DNA甲基化測序原始樣本數(shù)據(jù),移除reads上的接頭序列和低質(zhì)量的堿基,對可靠樣本數(shù)據(jù)進(jìn)行針對甲基化的生信轉(zhuǎn)換,輸出生信轉(zhuǎn)換后的DNA甲基化的測序可靠樣本數(shù)據(jù);
步驟2)的詳細(xì)步驟包括:
2.1)讀取上述生信轉(zhuǎn)換后的參考基因組數(shù)據(jù)及其索引;讀取上述修剪后的DNA甲基化測序可靠樣本數(shù)據(jù)和生信轉(zhuǎn)換后的DNA甲基化測序可靠樣本數(shù)據(jù);
2.2)根據(jù)上述生信轉(zhuǎn)換后的參考基因組數(shù)據(jù)的索引,通過CPU調(diào)用FPGA上硬件實(shí)現(xiàn)的比對器將上述生信轉(zhuǎn)換后的DNA甲基化測序可靠樣本數(shù)據(jù)和上述生信轉(zhuǎn)換后的參考基因組數(shù)據(jù)進(jìn)行精確比對,建立上述生信轉(zhuǎn)換后的DNA甲基化測序可靠樣本數(shù)據(jù)和上述生信轉(zhuǎn)換后的參考基因組數(shù)據(jù)之間的映射關(guān)系;
2.3)判斷DNA甲基化測序樣本數(shù)據(jù)是否為雙端reads,如果是雙端reads,則跳轉(zhuǎn)執(zhí)行步驟2.4);否則為單端reads,跳轉(zhuǎn)執(zhí)行步驟2.5);不明確的reads則直接移除;
2.4)對于雙端reads,在不匹配數(shù)受控以及雙端reads之間的讀距受控條件下,根據(jù)上述生信轉(zhuǎn)換后的參考基因組數(shù)據(jù)的索引,再次通過CPU調(diào)用FPGA上硬件實(shí)現(xiàn)的比對器將上述生信轉(zhuǎn)換后的DNA甲基化測序可靠樣本數(shù)據(jù)和上述生信轉(zhuǎn)換后的參考基因組數(shù)據(jù)進(jìn)行比對,增加建立上述生信轉(zhuǎn)換后的DNA甲基化測序可靠樣本數(shù)據(jù)和上述生信轉(zhuǎn)換后的參考基因組數(shù)據(jù)之間的映射關(guān)系;跳轉(zhuǎn)執(zhí)行步驟2.6);
2.5)對于單端reads,在不匹配數(shù)受控的條件下,根據(jù)上述生信轉(zhuǎn)換后的參考基因組數(shù)據(jù)的索引,再次通過CPU調(diào)用FPGA上硬件實(shí)現(xiàn)的比對器將上述生信轉(zhuǎn)換后的DNA甲基化測序可靠樣本數(shù)據(jù)和上述生信轉(zhuǎn)換后的參考基因組數(shù)據(jù)進(jìn)行比對,增加建立上述生信轉(zhuǎn)換后的DNA甲基化測序可靠樣本數(shù)據(jù)和上述生信轉(zhuǎn)換后的參考基因組數(shù)據(jù)之間的映射關(guān)系;
2.6)根據(jù)上述比對結(jié)果,移除重復(fù)的reads;
2.7)根據(jù)上述比對結(jié)果,生成基本的統(tǒng)計信息,所述基本的統(tǒng)計信息包括比對率統(tǒng)計、甲基化密度水平統(tǒng)計的至少一種;
2.8)輸出上述數(shù)據(jù)比對結(jié)果和基本統(tǒng)計信息。
2.根據(jù)權(quán)利要求1所述的DNA甲基化測序數(shù)據(jù)計算解讀方法,其特征在于,步驟1)中對用于DNA甲基化測序的參考基因組數(shù)據(jù)和原始的測序樣本數(shù)據(jù)進(jìn)行預(yù)處理是在CPU上基于不同的線程并發(fā)執(zhí)行的。
3.根據(jù)權(quán)利要求1所述的DNA甲基化測序數(shù)據(jù)計算解讀方法,其特征在于,步驟3)的詳細(xì)步驟包括:
3.1)讀取上述生信轉(zhuǎn)換后的參考基因組數(shù)據(jù)及其索引;讀取上述修剪后的DNA甲基化測序可靠樣本數(shù)據(jù)和生信轉(zhuǎn)換后的DNA甲基化測序可靠樣本數(shù)據(jù);讀取上述數(shù)據(jù)比對的結(jié)果信息;讀取上述基本統(tǒng)計結(jié)果信息;
3.2)識別每個有效的甲基化位點(diǎn);
3.3)進(jìn)行各種指定的特殊甲基化區(qū)的識別;
3.4)通過CPU調(diào)用FPGA上硬件實(shí)現(xiàn)的深度學(xué)習(xí)模型負(fù)責(zé)并行執(zhí)行ASMs識別;
3.5)輸出甲基化識別結(jié)果信息。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于人和未來生物科技(長沙)有限公司,未經(jīng)人和未來生物科技(長沙)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710362178.4/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F19-00 專門適用于特定應(yīng)用的數(shù)字計算或數(shù)據(jù)處理的設(shè)備或方法
G06F19-10 .生物信息學(xué),即計算分子生物學(xué)中的遺傳或蛋白質(zhì)相關(guān)的數(shù)據(jù)處理方法或系統(tǒng)
G06F19-12 ..用于系統(tǒng)生物學(xué)的建模或仿真,例如:概率模型或動態(tài)模型,遺傳基因管理網(wǎng)絡(luò),蛋白質(zhì)交互作用網(wǎng)絡(luò)或新陳代謝作用網(wǎng)絡(luò)
G06F19-14 ..用于發(fā)展或進(jìn)化的,例如:進(jìn)化的保存區(qū)域決定或進(jìn)化樹結(jié)構(gòu)
G06F19-16 ..用于分子結(jié)構(gòu)的,例如:結(jié)構(gòu)排序,結(jié)構(gòu)或功能關(guān)系,蛋白質(zhì)折疊,結(jié)構(gòu)域拓?fù)洌媒Y(jié)構(gòu)數(shù)據(jù)的藥靶,涉及二維或三維結(jié)構(gòu)的
G06F19-18 ..用于功能性基因組學(xué)或蛋白質(zhì)組學(xué)的,例如:基因型–表型關(guān)聯(lián),不均衡連接,種群遺傳學(xué),結(jié)合位置鑒定,變異發(fā)生,基因型或染色體組的注釋,蛋白質(zhì)相互作用或蛋白質(zhì)核酸的相互作用
- 序數(shù)鐘表
- 一種時序數(shù)據(jù)的處理方法及裝置
- 一種FPGA程序數(shù)據(jù)的加載方法及裝置
- 一種時序數(shù)據(jù)流分割方法、裝置及其存儲介質(zhì)
- 一種工業(yè)時序數(shù)據(jù)的訪問方法及系統(tǒng)
- 一種時序數(shù)據(jù)的平滑處理方法和裝置
- 時序數(shù)據(jù)多層次語義裁剪方法、裝置、電子設(shè)備及介質(zhì)
- 一種數(shù)據(jù)存儲方法、裝置、服務(wù)器及存儲介質(zhì)
- 一種時序數(shù)據(jù)異常檢測方法、裝置、設(shè)備及存儲介質(zhì)
- 一種基因測序數(shù)據(jù)排序方法、集成電路及排序設(shè)備





