[發明專利]一種編碼區域遺傳變異致病性分類的數據處理系統與方法有效
| 申請號: | 201811374374.4 | 申請日: | 2018-11-19 |
| 公開(公告)號: | CN109616155B | 公開(公告)日: | 2023-04-18 |
| 發明(設計)人: | 諸峰 | 申請(專利權)人: | 江蘇科技大學 |
| 主分類號: | G16B20/50 | 分類號: | G16B20/50 |
| 代理公司: | 南京正聯知識產權代理有限公司 32243 | 代理人: | 王素琴 |
| 地址: | 212003*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 編碼 區域 遺傳 變異 致病性 分類 數據處理系統 方法 | ||
1.一種編碼區域遺傳變異致病性分類的數據處理系統,其特征在于,所述系統基于ACMG指南為理論依據構建,所述系統包括依次連接的變異位點發現模塊、變異位點注釋模塊、數據及資源加載模塊、致病性判別與分類模塊和結果解釋與驗證模塊,針對目標基因集、全外顯子組測序數據,實現對大規模樣本及海量變異位點信息的半自動和系統化的處理,其中:
變異位點發現模塊,用于找尋編碼區域內遺傳變異致病性變異位點的具體位置;所述變異位點包括SNPs和小片段的INDELs;
變異位點注釋模塊,用于對變異位點進行信息注釋,并生成與每個所述變異位點對應的數據文件;所述信息注釋包括所述變異位點所在染色體、參考等位基因、替換等位基因、所在外顯子位置、罕見性、所在基因、氨基酸變化、各類可計算工具對變異有害性計算得分及預測結果、不同人群中變異頻率信息的注釋;
數據及資源加載模塊,用于讀取致病性判別的外部資源文件和所述數據文件;所述外部資源文件包括所述致病性判別的基因列表、Clinvar、OMIM、dbscSNV和dbNSFP數據庫;所述注釋數據加載單元用于讀取所述數據文件并存儲;
致病性判斷與分類模塊,用于計算所述數據文件中每一所述變異位點中所有判別項的取值,并對每一判別項進行打分,將所有判別項按打分進行匯總操作,并根據匯總的情況對所有遺傳變異的致病性進行分類;所述判別項包括PVS1、PS1、PS4、PM1、PM2、PM4、PM5、PP2、PP3、PP5、BS1、BS2、BP1、BP3、BP4、BP6、BP7和BA1;
結果解釋和驗證模塊,包括結果解釋單元和驗證單元,結果解釋單元用于給出致病性判別與分類模塊的判別結果和分類結果的分類依據,并給出可視化界面,供人工參考,根據實際情況作出遺傳變異的致病性判別;驗證單元用于對遺傳變異的致病性分類與Clinvar、InterVar遺傳變異數據解讀工具結果進行比對,若分類與Clinvar、InterVar遺傳變異數據解讀工具結果進行比對的比對結果不一致,則需要著重標識出來,由人工進一步進行審核,并對分類進行確定。
2.根據權利要求1所述的一種編碼區域遺傳變異致病性分類的數據處理系統,其特征在于,所述變異位點發現模塊包括序列比對與映射單元、序列數據預處理單元和SNPs與小片段INDELs變異發現單元;所述序列比對與映射單元用于接收由序列數據構成的原始測序數據,并將序列數據映射到參考基因組上;所述序列數據預處理單元用于對映射到參考基因組上的序列數據做預處理操作;所述SNPs與小片段INDELs變異發現單元用于識別預處理后的序列數據相對參考基因組的變異位點,并計算每一所述變異位點的基因型。
3.根據權利要求2所述的一種編碼區域遺傳變異致病性分類的數據處理系統,其特征在于,所述變異位點發現模塊輸入為fastq格式的原始測序數據文件,所述變異位點發現模塊輸出為包含所有變異位點的vcf格式文件。
4.根據權利要求3所述的一種編碼區域遺傳變異致病性分類的數據處理系統,其特征在于,所述變異位點發現模塊使用BWA-MEM算法完成所述原始測序數據的映射操作;所述變異位點發現模塊使用GATK工具實現對所述變異位點的尋找操作。
5.根據權利要求1所述的一種編碼區域遺傳變異致病性分類的數據處理系統,其特征在于,所述變異位點注釋模塊包括位點注釋單元,所述位點注釋單元對所述SNPs和所述小片段INDELs進行注釋,并能夠選擇指定所述變異位點進行信息注釋;具體過程如下:首先解析由變異位點發現模塊生成的VCF文件,輸出文件為包含變異染色體編號、變異坐標起點終點位置、參考等位基因、替換等位基因;隨后以該文件作為輸入,得到包含基因名、基因區域、轉錄組編碼、蛋白編碼信息的輸出文件;緊接著,通過氨基酸、序列數據資源,獲得變異所在的外顯子位置,并對變異的類型進行分類,得到變異堿基的變化以及氨基酸的變化信息;并分析變異是否發生在剪接位點,并獲取該剪接位點編碼;最后,借助dbNSFP數據庫資源,得到變異的SIFT、Polyphen2、MutationTaster、LRT、FATHMM、CADD、MetaSVM、Clinvar、InterVar功能預測工具的分數和預測結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于江蘇科技大學,未經江蘇科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811374374.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:測序深度的矯正方法及裝置
- 下一篇:一種基因測序數據存儲方法和裝置





