[發明專利]易感基因型檢測方法在審
| 申請號: | 201710386766.1 | 申請日: | 2017-05-26 |
| 公開(公告)號: | CN107292129A | 公開(公告)日: | 2017-10-24 |
| 發明(設計)人: | 吳小龍;黃宇 | 申請(專利權)人: | 中國科學院上海藥物研究所 |
| 主分類號: | G06F19/22 | 分類號: | G06F19/22 |
| 代理公司: | 北京金信知識產權代理有限公司11225 | 代理人: | 劉鋒,張曉丹 |
| 地址: | 201203 上海*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基因型 檢測 方法 | ||
技術領域
本發明涉及生物信息、計算機、醫學及基因學技術領域,尤其涉及一種易感基因型檢測方法。
背景技術
I型神經纖維瘤(英文:Neurofibromatosis type I,縮寫:NF1)的形成與NF1基因蛋白的表達缺失有關,以多發性咖啡牛奶斑、腋窩或腹股溝斑點、多發性皮膚纖維瘤和虹膜Lisch結節為特征。該疾病的外顯率為100%、患病率約1/3000,其中30%~50%的病例為自發突變所致,是人類突變率最高的疾病之一。
I型神經纖維瘤的突變率高是由于NF1基因的突變率高,約50%的患者是新突變,且貫穿整個NF1基因。
近年來研究多集中在探索NF1基因的突變熱點,但是該研究方向迫切需要快速分析和尋找突變位點的方法。隨著生物信息技術的發展,大量的測序數據出現,生物信息的研究也進入了大數據時代。針對大數據分析,需要多個學科人才和多種軟件上的銜接和操作,而且操作流程繁瑣。目前并沒有可以利用生物信息學及大數據分析的高效地分析待檢測樣本中是否存在I型神經纖維瘤基因的突變位點的方法,無法使尋找NF1突變位點的過程實現自動化。
發明內容
為解決上述問題,本發明提供一種易感基因型檢測方法,可以高效地檢測出待檢測樣本中是否存在待檢測的基因突變位點,為疾病的臨床診斷及產前篩查提供指導。
為實現上述目的,本發明的一種易感基因型檢測方法,包括以下步驟:
S1、采集待檢測樣本,捕獲待檢測樣本的外顯子區域序列,構成原始測序數據;
S2、逐一對原始測序數據中的各個序列進行質量檢測,根據質量檢測的結果,獲得符合質量要求的序列,構成初步調整數據;
S3、將初步調整數據中的各個序列與參考基因組序列進行比對,獲得比對結果,構成變異檢測數據;
S4、對變異檢測數據中的各個序列進行變異檢測分析,確定變異檢測數據中的具有突變基因的基因序列和突變基因對應的突變位點;
S5、對突變位點進行功能性注釋,并確定待檢測樣本中是否包含待檢測的易感基因型。
進一步地,待檢測的易感基因型為I型神經纖維瘤易感基因型,包括I型神經纖維瘤基因中rs1801052為AA的基因型和rs1129506為AA的基因型。
進一步地,待檢測樣本為患者體細胞的全外顯子組序列。
進一步地,還包括:當確定待檢測樣本中包含待檢測的易感基因型時,根據患者直系親屬的體細胞的全外顯子組序列,驗證對待檢測樣本的檢測結果。
進一步地,還包括,對已進行功能性注釋的帶有突變基因的基因序列進行附加檢測,獲得變異有害性、候選基因、蛋白質突變中的一個或者多個相關檢測結果。
進一步地,還包括,對原始測序數據中的各個序列進行質量檢測前,先去除各序列的序列接頭。
進一步地,原始測序數據中符合質量要求的序列包括含N低于5%,并且堿基質量值高于30的比例(Q30)在80%以上的序列。
進一步地,變異檢測分析包括單核苷酸多態性檢測、插入及缺失檢測和拷貝數變異檢測。
進一步地,功能性注釋的注釋位置包括突變位點的基因區、基因區間和非翻譯區。
進一步地,還包括:根據步驟S2-S5的結果分別匯總質量數據報告、對比數據報告、突變數據報告和突變功能評估報告,并根據質量數據報告、對比數據報告、突變數據報告和突變功能評估報告輸出易感基因型檢測結果報告。
本發明的易感基因型檢測方法,通過運用準確高效的生物信息學分析方法,完成從原始基因數據到突變基因的突變位點檢測的管道式流程,提高了對待檢測樣本的突變位點檢測分析的效率,降低易感基因型檢測的成本。本發明的易感基因型檢測方法可植入性強,不但可以作為獨立的I型神經纖維瘤易感基因型檢測分析方法進行檢測,也可植入到其他的分析流程中,作為其他分析流程中的檢測部分,并且還可以用于對其他疾病的突變位點進行檢測,為疾病的數據挖掘提供準確的資源。
附圖說明
圖1為本發明的易感基因型檢測方法的流程圖。
具體實施方式
下面,結合附圖,對本發明的結構以及工作原理等作進一步的說明。
如圖1所示,本發明的一種易感基因型檢測方法,包括以下步驟:
S1、采集待檢測樣本,捕獲待檢測樣本的外顯子區域序列,構成原始測序數據。
S2、逐一對原始測序數據中的各個序列進行質量檢測,根據質量檢測的結果,獲得符合質量要求的序列,構成初步調整數據。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院上海藥物研究所,未經中國科學院上海藥物研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710386766.1/2.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06F 電數字數據處理
G06F19-00 專門適用于特定應用的數字計算或數據處理的設備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質相關的數據處理方法或系統
G06F19-12 ..用于系統生物學的建?;蚍抡?,例如:概率模型或動態模型,遺傳基因管理網絡,蛋白質交互作用網絡或新陳代謝作用網絡
G06F19-14 ..用于發展或進化的,例如:進化的保存區域決定或進化樹結構
G06F19-16 ..用于分子結構的,例如:結構排序,結構或功能關系,蛋白質折疊,結構域拓撲,用結構數據的藥靶,涉及二維或三維結構的
G06F19-18 ..用于功能性基因組學或蛋白質組學的,例如:基因型–表型關聯,不均衡連接,種群遺傳學,結合位置鑒定,變異發生,基因型或染色體組的注釋,蛋白質相互作用或蛋白質核酸的相互作用





