[發(fā)明專利]一種腫瘤靶向基因測(cè)序數(shù)據(jù)解析方法在審
| 申請(qǐng)?zhí)枺?/td> | 201710739726.0 | 申請(qǐng)日: | 2017-08-25 |
| 公開(公告)號(hào): | CN107577921A | 公開(公告)日: | 2018-01-12 |
| 發(fā)明(設(shè)計(jì))人: | 李志廣;呂德康;張學(xué)紅;張宇 | 申請(qǐng)(專利權(quán))人: | 云壹生物技術(shù)(大連)有限公司 |
| 主分類號(hào): | G06F19/22 | 分類號(hào): | G06F19/22;G06F19/00 |
| 代理公司: | 沈陽杰克知識(shí)產(chǎn)權(quán)代理有限公司21207 | 代理人: | 羅瑩 |
| 地址: | 116023 遼寧省大連市高*** | 國(guó)省代碼: | 遼寧;21 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 腫瘤 靶向 基因 序數(shù) 解析 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及基因組學(xué)高通量測(cè)序數(shù)據(jù)分析領(lǐng)域,具體包括對(duì)靶向基因文庫測(cè)序數(shù)據(jù)進(jìn)行質(zhì)量控制、擴(kuò)增子效率評(píng)估和過濾、基因組比對(duì)、突變識(shí)別及注釋,進(jìn)而結(jié)合已記錄突變及病例資料完成統(tǒng)計(jì)分析,為腫瘤患者提供一整套非定制腫瘤基因突變檢測(cè)分析解決方案,為腫瘤個(gè)體化醫(yī)療提供技術(shù)支持。
背景技術(shù)
腫瘤在本質(zhì)上是基因病。各種環(huán)境的和遺傳的致癌因素以協(xié)同的方式引起DNA損害,從而激活原癌基因和(或)滅活腫瘤抑制基因,加之凋亡調(diào)節(jié)基因和(或)DNA修復(fù)基因的改變,繼而引起表達(dá)水平的異常,使靶細(xì)胞逐步向癌細(xì)胞發(fā)生轉(zhuǎn)化。被轉(zhuǎn)化的細(xì)胞先呈現(xiàn)多克隆性的增生,經(jīng)過一個(gè)漫長(zhǎng)的多階段的演進(jìn)過程,其中一個(gè)克隆相對(duì)無限制的擴(kuò)增,通過累積附加突變,選擇性地形成具有不同特點(diǎn)的亞克隆(異質(zhì)化),從而獲得浸潤(rùn)和轉(zhuǎn)移的能力(惡性轉(zhuǎn)化),形成惡性腫瘤。
腫瘤基因檢測(cè)是提取人體細(xì)胞內(nèi)的遺傳物質(zhì),通過測(cè)序檢測(cè)人體內(nèi)的腫瘤基因或易感基因,用于腫瘤的預(yù)防、診斷、預(yù)后預(yù)測(cè)、靶向用藥、術(shù)后監(jiān)控等。
靶向測(cè)序是對(duì)特定長(zhǎng)度的PCR產(chǎn)物或者捕獲的片段進(jìn)行測(cè)序,分析序列中的變異。靶向測(cè)序能夠根據(jù)不同需求,對(duì)目標(biāo)區(qū)域進(jìn)行高覆蓋度的測(cè)序,還可以檢測(cè)到低頻突變。隨著測(cè)序成本的減少以及人類功能基因組學(xué)研究的深入,靶向測(cè)序已經(jīng)從研究機(jī)構(gòu)走向臨床,用于遺傳篩查、疾病風(fēng)險(xiǎn)評(píng)估、腫瘤診治以及精準(zhǔn)用藥等多個(gè)領(lǐng)域。
靶向測(cè)序數(shù)據(jù)分析的問題:第一,尚無靶向測(cè)序數(shù)據(jù)工具能結(jié)合已知突變數(shù)據(jù)庫或病例資料進(jìn)行統(tǒng)計(jì)分析,不能給出與疾病顯著相關(guān)的突變分析結(jié)果。第二,一般分析軟件只滿足固定panel文庫測(cè)序數(shù)據(jù)的分析,如illumina公司的TrueSeqAmplicon,無法滿足不同需求的用戶的靶向文庫分析。第三,現(xiàn)有方法中,沒有評(píng)估擴(kuò)增子的擴(kuò)增效率并對(duì)引物序列進(jìn)行修剪的操作,如果不做處理兩者均會(huì)導(dǎo)致后續(xù)的突變分析得到的SNV結(jié)果具有較高的假陽性,從而影響分析結(jié)論。
發(fā)明內(nèi)容
針對(duì)現(xiàn)有分析方法存在的缺陷,本發(fā)明為自主設(shè)計(jì)的靶向基因測(cè)序數(shù)據(jù)分析提供了一整套解決方案。
本發(fā)明目的是通過下述技術(shù)方案實(shí)現(xiàn)的:
一種腫瘤靶向基因測(cè)序數(shù)據(jù)解析方法,其特征在于,包括以下步驟:
步驟一:獲取含有突變信息的讀段序列,即高通量的測(cè)序數(shù)據(jù);
步驟二:測(cè)序數(shù)據(jù)的質(zhì)量控制,通過fastqc軟件對(duì)步驟一獲取的所有測(cè)序數(shù)據(jù)進(jìn)行質(zhì)量分析,獲得測(cè)序數(shù)據(jù)質(zhì)量控制報(bào)告,并過濾掉被報(bào)告為低質(zhì)量的數(shù)據(jù);
步驟三:統(tǒng)計(jì)不同擴(kuò)增區(qū)域的擴(kuò)增效率,刪除擴(kuò)增異常的數(shù)據(jù);
步驟四:刪除測(cè)序數(shù)據(jù)讀段序列中的引物序列,即獲得讀段序列中真正的目標(biāo)區(qū)域DNA序列;
步驟五:將步驟四中得到的所有序列數(shù)據(jù)比對(duì)到靶向區(qū)域上,獲得比對(duì)結(jié)果數(shù)據(jù);
步驟六:應(yīng)用突變識(shí)別工具從比對(duì)結(jié)果數(shù)據(jù)中檢測(cè)所有突變;
步驟七:統(tǒng)計(jì)擴(kuò)增區(qū)域內(nèi)所有覆蓋堿基的測(cè)序深度,根據(jù)突變位點(diǎn)的測(cè)序深度篩選可靠性高的突變;
步驟八:結(jié)合已注釋在癌癥相關(guān)數(shù)據(jù)庫中的突變篩選差異顯著的突變;
步驟九:結(jié)合病例的臨床資料信息,對(duì)各種突變進(jìn)行統(tǒng)計(jì)分析,識(shí)別與性狀顯著相關(guān)的胚系突變(germline mutations)及體細(xì)胞突變(somatic mutations);
步驟十:以圖表的形式生成數(shù)據(jù)分析報(bào)告。
所述的測(cè)序數(shù)據(jù)來自包括IlluminaMiseq/Hiseq在內(nèi)的高通量測(cè)序平臺(tái)的靶向擴(kuò)增文庫,靶向區(qū)域可定制,即在首次分析時(shí)提供所有靶位點(diǎn)基因組定位信息。
步驟二中所述的低質(zhì)量數(shù)據(jù)是指單堿基平均測(cè)序質(zhì)量得分低于20的測(cè)序數(shù)據(jù)。
步驟三中擴(kuò)增區(qū)域異常數(shù)據(jù)獲取及刪除過程如下:
(1)將測(cè)序得到的讀段數(shù)據(jù)比對(duì)到靶向參考基因組上;
(2)判斷讀段的兩端序列所對(duì)應(yīng)的擴(kuò)增子引物序列是否來自同一個(gè)引物對(duì),即允許前引物和后引物與測(cè)序片段的5’和3’端各有2個(gè)錯(cuò)配,去除不符合條件的讀段序列;
(3)統(tǒng)計(jì)覆蓋到每對(duì)擴(kuò)增子對(duì)應(yīng)的靶向擴(kuò)增區(qū)域的讀段序列,并應(yīng)用擴(kuò)增數(shù)來衡量和比較它們的擴(kuò)增效率;
(4)當(dāng)擴(kuò)增數(shù)小于所有擴(kuò)增子對(duì)應(yīng)的擴(kuò)增數(shù)均值的1/3時(shí),則判斷該擴(kuò)增子所對(duì)應(yīng)的擴(kuò)增區(qū)域存在異常,并將其擴(kuò)增出來的所有讀段序列在分析中刪除。
所述步驟五中的比對(duì)過程需要根據(jù)首次提供的靶向區(qū)域基因組位置信息,提取這些靶向區(qū)域在基因組中的核酸序列信息,并生成索引。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于云壹生物技術(shù)(大連)有限公司,未經(jīng)云壹生物技術(shù)(大連)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710739726.0/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F19-00 專門適用于特定應(yīng)用的數(shù)字計(jì)算或數(shù)據(jù)處理的設(shè)備或方法
G06F19-10 .生物信息學(xué),即計(jì)算分子生物學(xué)中的遺傳或蛋白質(zhì)相關(guān)的數(shù)據(jù)處理方法或系統(tǒng)
G06F19-12 ..用于系統(tǒng)生物學(xué)的建模或仿真,例如:概率模型或動(dòng)態(tài)模型,遺傳基因管理網(wǎng)絡(luò),蛋白質(zhì)交互作用網(wǎng)絡(luò)或新陳代謝作用網(wǎng)絡(luò)
G06F19-14 ..用于發(fā)展或進(jìn)化的,例如:進(jìn)化的保存區(qū)域決定或進(jìn)化樹結(jié)構(gòu)
G06F19-16 ..用于分子結(jié)構(gòu)的,例如:結(jié)構(gòu)排序,結(jié)構(gòu)或功能關(guān)系,蛋白質(zhì)折疊,結(jié)構(gòu)域拓?fù)洌媒Y(jié)構(gòu)數(shù)據(jù)的藥靶,涉及二維或三維結(jié)構(gòu)的
G06F19-18 ..用于功能性基因組學(xué)或蛋白質(zhì)組學(xué)的,例如:基因型–表型關(guān)聯(lián),不均衡連接,種群遺傳學(xué),結(jié)合位置鑒定,變異發(fā)生,基因型或染色體組的注釋,蛋白質(zhì)相互作用或蛋白質(zhì)核酸的相互作用
- 心腦血管疾病易感基因芯片檢測(cè)試劑盒
- 一組用于頭頸部鱗狀細(xì)胞癌分子分型的基因及其應(yīng)用
- 產(chǎn)β-丙氨酸的重組菌及其構(gòu)建方法與應(yīng)用
- 一種檢測(cè)高血壓藥物代謝相關(guān)基因的引物組和試劑盒
- 一組用于腎細(xì)胞癌分子分型的基因及其應(yīng)用
- 一組用于膀胱癌檢測(cè)的基因及其應(yīng)用
- 一組用于髓母細(xì)胞瘤分子分型的基因及其應(yīng)用
- 一種頭發(fā)相關(guān)的基因位點(diǎn)庫及其應(yīng)用
- 馬度米星化合物的生物合成基因簇及其應(yīng)用
- 彌漫性大B細(xì)胞淋巴瘤分子分型試劑盒及分型裝置
- 序數(shù)鐘表
- 一種時(shí)序數(shù)據(jù)的處理方法及裝置
- 一種FPGA程序數(shù)據(jù)的加載方法及裝置
- 一種時(shí)序數(shù)據(jù)流分割方法、裝置及其存儲(chǔ)介質(zhì)
- 一種工業(yè)時(shí)序數(shù)據(jù)的訪問方法及系統(tǒng)
- 一種時(shí)序數(shù)據(jù)的平滑處理方法和裝置
- 時(shí)序數(shù)據(jù)多層次語義裁剪方法、裝置、電子設(shè)備及介質(zhì)
- 一種數(shù)據(jù)存儲(chǔ)方法、裝置、服務(wù)器及存儲(chǔ)介質(zhì)
- 一種時(shí)序數(shù)據(jù)異常檢測(cè)方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種基因測(cè)序數(shù)據(jù)排序方法、集成電路及排序設(shè)備





