[發明專利]一種腫瘤靶向基因測序數據解析方法在審
| 申請號: | 201710739726.0 | 申請日: | 2017-08-25 |
| 公開(公告)號: | CN107577921A | 公開(公告)日: | 2018-01-12 |
| 發明(設計)人: | 李志廣;呂德康;張學紅;張宇 | 申請(專利權)人: | 云壹生物技術(大連)有限公司 |
| 主分類號: | G06F19/22 | 分類號: | G06F19/22;G06F19/00 |
| 代理公司: | 沈陽杰克知識產權代理有限公司21207 | 代理人: | 羅瑩 |
| 地址: | 116023 遼寧省大連市高*** | 國省代碼: | 遼寧;21 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 腫瘤 靶向 基因 序數 解析 方法 | ||
1.一種腫瘤靶向基因測序數據解析方法,其特征在于,包括以下步驟:
步驟一:獲取含有突變信息的讀段序列,即高通量的測序數據;
步驟二:測序數據的質量控制,通過fastqc軟件對步驟一獲取的所有測序數據進行質量分析,獲得測序數據質量控制報告,并過濾掉被報告為低質量的數據;
步驟三:統計不同擴增區域的擴增效率,刪除擴增異常的數據;
步驟四:刪除測序數據讀段序列中的引物序列,即獲得讀段序列中真正的目標區域DNA序列;
步驟五:將步驟四中得到的所有序列數據比對到靶向區域上,獲得比對結果數據;
步驟六:應用突變識別工具從比對結果數據中檢測所有突變;
步驟七:統計擴增區域內所有覆蓋堿基的測序深度,根據突變位點的測序深度篩選可靠性高的突變;
步驟八:結合已注釋在癌癥相關數據庫中的突變篩選差異顯著的突變;
步驟九:結合病例的臨床資料信息,對各種突變進行統計分析,識別與性狀顯著相關的胚系突變(germline mutations)及體細胞突變(somatic mutations);
步驟十:以圖表的形式生成數據分析報告。
2.根據權利要求1所述的一種腫瘤靶向基因測序數據解析方法,其特征在于,所述的測序數據來自包括IlluminaMiseq/Hiseq在內的高通量測序平臺的靶向擴增文庫,靶向區域可定制,即在首次分析時提供所有靶位點基因組定位信息。
3.根據權利要求1所述的一種腫瘤靶向基因測序數據解析方法,其特征在于,步驟二中所述的低質量數據是指單堿基平均測序質量得分低于20的測序數據。
4.根據權利要求1所述的一種腫瘤靶向基因測序數據解析方法,其特征在于,步驟三中擴增區域異常數據獲取及刪除過程如下:
(1)將測序得到的讀段數據比對到靶向參考基因組上;
(2)判斷讀段的兩端序列所對應的擴增子引物序列是否來自同一個引物對,即允許前引物和后引物與測序片段的5’和3’端各有2個錯配,去除不符合條件的讀段序列;
(3)統計覆蓋到每對擴增子對應的靶向擴增區域的讀段序列,并應用擴增數來衡量和比較它們的擴增效率;
(4)當擴增數小于所有擴增子對應的擴增數均值的1/3時,則判斷該擴增子所對應的擴增區域存在異常,并將其擴增出來的所有讀段序列在分析中刪除。
5.根據權利要求1所述的一種腫瘤靶向基因測序數據解析方法,其特征在于,所述步驟五中的比對過程需要根據首次提供的靶向區域基因組位置信息,提取這些靶向區域在基因組中的核酸序列信息,并生成索引。
6.根據權利要求1所述的一種腫瘤靶向基因測序數據解析方法,其特征在于,步驟七中對于所有突變位點,只將在該位點測序深度超過100×的病例納入統計分析。
7.根據權利要求1所述的一種腫瘤靶向基因測序數據解析方法,其特征在于,步驟八中差異顯著的突變的篩選是基于目前已知的癌癥相關數據庫中存儲的數據來進行的。
8.根據權利要求1所述的一種腫瘤靶向基因測序數據解析方法,其特征在于,步驟九中的臨床資料信息的關聯分析,具體應用R統計軟件中的卡方檢驗函數對患者的臨床資料,包括年齡、性別、癌癥TNM分期、腫瘤體積、腫塊大小、是否有淋巴結侵襲、Ki67惡性程度、組織亞型,進行關聯分析,找出與特定基因突變發生相關的風險因素,即是否具有某一臨床特征的病人傾向于發生哪些特異的突變。
9.如權利要求1-8中任意一項所述方法,其特征在于,所述參考序列是來源于UCSC公共數據庫的參考腫瘤基因或人類參考基因組序列。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于云壹生物技術(大連)有限公司,未經云壹生物技術(大連)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710739726.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種新型電梯層門輔助擋板
- 下一篇:單繩提升機鋼絲繩松繩檢測裝置
- 同類專利
- 專利分類
G06F 電數字數據處理
G06F19-00 專門適用于特定應用的數字計算或數據處理的設備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質相關的數據處理方法或系統
G06F19-12 ..用于系統生物學的建模或仿真,例如:概率模型或動態模型,遺傳基因管理網絡,蛋白質交互作用網絡或新陳代謝作用網絡
G06F19-14 ..用于發展或進化的,例如:進化的保存區域決定或進化樹結構
G06F19-16 ..用于分子結構的,例如:結構排序,結構或功能關系,蛋白質折疊,結構域拓撲,用結構數據的藥靶,涉及二維或三維結構的
G06F19-18 ..用于功能性基因組學或蛋白質組學的,例如:基因型–表型關聯,不均衡連接,種群遺傳學,結合位置鑒定,變異發生,基因型或染色體組的注釋,蛋白質相互作用或蛋白質核酸的相互作用





