[發明專利]一種審核高通量測序基因變異檢測結果的方法在審
| 申請號: | 202010135146.2 | 申請日: | 2020-03-02 |
| 公開(公告)號: | CN111304308A | 公開(公告)日: | 2020-06-19 |
| 發明(設計)人: | 譚達;王思振 | 申請(專利權)人: | 北京泛生子基因科技有限公司 |
| 主分類號: | C12Q1/6869 | 分類號: | C12Q1/6869;C12Q1/6886 |
| 代理公司: | 北京紀凱知識產權代理有限公司 11245 | 代理人: | 關暢;張立娜 |
| 地址: | 102206 北京市昌平區中*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 審核 通量 基因 變異 檢測 結果 方法 | ||
本發明公開了一種審核高通量測序基因變異檢測結果的方法。該方法包括如下步驟:構建訓練集,包括若干陽性變異位點和陰性非變異位點的測序數據;提取并向量化變異位點特征;采用隨機森林法構建模型,然后利用模型判斷待測位點變異是否為變異位點。本發明方法能快速、準確完成原需人工檢視突變的環節,大大節約人力成本、提高整體變異檢測效率;達到甚至在一定程度上超越了人工審核的準確度,并能大大降低人工檢驗的主觀性;使用機器學習算法,在該領域具有一定創新;基于真實的臨床數據開發模型,更貼近于真實案例,并在金標準數據集上表現與人工結果無出其二,并能適配各種不同的細胞變異檢測軟件,具有良好的實用性。
技術領域
本發明涉及生物信息學領域,具體涉及一種審核高通量測序基因變異檢測結果的方法。
背景技術
目前,在體細胞變異檢測中,二代測序技術已得到了極為廣泛的應用,并為臨床中的用藥指導、預后監測等提供了必要的基礎。因而變異檢測的準確性成為精準醫療的一個必要前提。然而,精確地檢測體細胞變異(尤其是低頻變異)面臨著樣本制備損壞、測序錯誤、參考基因組序列比對錯誤等一系列問題的嚴峻挑戰。用于體細胞變異檢測的生物信息學軟件則是下游、同時也是十分重要的一環。目前眾多優秀的變異檢測軟件(如Mutect,Strelka,Varscan等)在體細胞變異檢測市場上得到了廣泛的應用。然而,面對復雜的變異情況,一般常用的變異檢測軟件檢出來的變異結果都存在一定比例的錯誤(從15%到30%不等),故都需要通過進一步的可視化的變異呈現軟件(例如最為常用軟件為IGV(Integrative Genome Viewer)[http://www.igv.org/])來進行人工的審核、排除假陽并給出最終的真實變異結果。然而,該人工審核過程存在三方面的不足:一、使用可視化軟件審核變異并給出較為準確的結果,需要比較深厚的生物信息學專業知識背景和長期的訓練,同時也存在較強的主觀判斷因素;二、在測序數據越來越龐大的情況下,人工審核過程效率和人工成本上在一定程度上制約著變異檢測的時效性和經濟性;三、人工審核的主觀性、審核標準的不統一性也對變異檢測的準確性構成了一定的威脅。由于IGV的審核規則存在較大的主觀性,目前Erica K.等對其判定準則的規范化進行了系統性的研究整理和測試(Standard operating procedure for somatic variant refinement of sequencingdata with paired tumor and normal samples DOI:10.1038/s41436-018-0278-z)。該研究通過一批金標準數據集,確立并驗證了一系列關于人工審核變異的標準。實驗中專業人員通過學習該套標準,其對體細胞變異判讀的準確性從77.4%提高到了94.1%。盡管IGV審核規則得到了專業性的確立和驗證,然而,人工審核時效低的問題還未得到有效的解決。
發明內容
針對上述問題,本發明的目的是利用機器學習算法及人工標注的金標準數據集,提供一種用來替代或者自動化人工審核體細胞變異的方法,即一種審核基因變異檢測結果的方法。
第一方面,本發明要求保護一種審核高通量測序基因變異檢測結果的方法。
本發明所要求保護的審核高通量測序基因變異檢測結果的方法,可包括如下步驟:
(A)構建訓練集,包括若干陽性變異位點和陰性非變異位點的測序數據。
(B)從訓練集中提取并向量化變異位點的特征;所述變異位點的特征包括以下任意6種或6種以上,例如任意7種、8種、9種、10種或11種:
突變支持數:腫瘤組織中支持待檢測突變位點的reads數;
突變頻率:腫瘤組織中待檢測突變位點的頻率;
堿基質量:腫瘤組織中支持待檢測突變位點的reads中待檢測突變位點的堿基質量的均值;
錯誤比對率:腫瘤組織中支持待檢測突變位點的reads中待檢測突變位點的上下游50bp序列錯誤比對率的均值;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京泛生子基因科技有限公司,未經北京泛生子基因科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010135146.2/2.html,轉載請聲明來源鉆瓜專利網。





