[發明專利]通過計算機程序模擬產生簡化DNA甲基化測序數據的方法有效
| 申請號: | 201710576797.3 | 申請日: | 2017-07-14 |
| 公開(公告)號: | CN107451419B | 公開(公告)日: | 2020-01-24 |
| 發明(設計)人: | 陸燕;孫喜偉;劉鵬淵;周莉媛 | 申請(專利權)人: | 浙江大學 |
| 主分類號: | G16B30/00 | 分類號: | G16B30/00;G16B5/00 |
| 代理公司: | 33200 杭州求是專利事務所有限公司 | 代理人: | 劉靜;邱啟旺 |
| 地址: | 310058 浙江*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 通過 計算機 程序 模擬 產生 簡化 dna 甲基化 序數 方法 | ||
1.一種通過計算機程序模擬產生簡化DNA甲基化測序數據的方法,其特征在于,具體包括以下四個步驟:
(1)模擬產生包含單堿基插入、缺失、單核苷酸變異和結構變異特性的參考基因組序列,變異參數由用戶設定;
(2)在步驟(1)得到的參考基因組序列上模擬CpG二核苷酸位點上的甲基化水平:使用Beta統計模型來產生CpG位點的甲基化數值;考慮到真實數據中鄰近CpG位點的強相關性,對100bp距離內的CpG位點的甲基化水平進行基于最大似然統計模型的修正;
(3)對步驟(2)得到的基因組序列進行計算機模擬生物體內的限制性酶切過程,記錄相應的切割位置得到切割片段fragments,然后根據服從泊松分布的覆蓋度參數,模擬產生單端或者雙端的測序讀長reads;通過內部選擇過程,得到定向或者非定向文庫的測序片段;
(4)模擬產生測序數據的質量文件:在Illumina測序中,堿基的測序質量值和它在讀長中所處位置有關,越靠后質量越低,使用大量真實數據訓練集來擬合Illumina測序的堿基質量分布,得到堿基的經驗誤差分布,并且用于產生數據的質量值情況。
2.根據權利要求1所述的通過計算機程序模擬產生簡化DNA甲基化測序數據的方法,其特征在于:所述參考基因組包括人類各個版本參考基因組。
3.根據權利要求1所述的通過計算機程序模擬產生簡化DNA甲基化測序數據的方法,其特征在于:所述計算機模擬的限制性酶切包括所有限制性內切酶。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江大學,未經浙江大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710576797.3/1.html,轉載請聲明來源鉆瓜專利網。





