[發明專利]一種無對照體細胞突變檢測方法及裝置有效
| 申請號: | 201910395409.0 | 申請日: | 2019-05-14 |
| 公開(公告)號: | CN109903811B | 公開(公告)日: | 2019-08-09 |
| 發明(設計)人: | 李超;王威;張兵 | 申請(專利權)人: | 慧算醫療科技(上海)有限公司 |
| 主分類號: | G16B20/20 | 分類號: | G16B20/20;G16B40/00 |
| 代理公司: | 上海光華專利事務所(普通合伙) 31219 | 代理人: | 朱凌嬌;許亦琳 |
| 地址: | 201203 上海市浦東新區中國*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 亞克隆 突變基因位點 克隆 驅動 突變 突變檢測 預測模型 體細胞 篩選 靶向治療 待測樣本 檢測數據 聚類算法 正常組織 治療效果 治療藥物 腫瘤治療 注釋信息 聚類 治療 腫瘤 預測 | ||
1.一種用于臨床研究和基礎研究的無對照體細胞突變檢測方法,所述方法無需源自自體的正常組織對照,所述方法至少包括以下步驟:
S1:獲取待測樣本的突變基因位點的檢測數據,所述突變基因位點的檢測數據包括堿基置換突變信息和拷貝數變異信息;
S2:根據所述突變基因位點的檢測數據信息,基于聚類算法對突變基因位點進行相似聚類,即形成亞克隆分層;
S3:注釋各亞克隆內各突變基因位點;
S4:建立亞克隆預測模型;
S5:將步驟S3得到的各亞克隆內各突變基因位點注釋信息輸入到所述亞克隆預測模型中,預測各亞克隆屬于第一克隆,第二克隆和第三克隆中的哪一類;所述第一克隆是指腫瘤的驅動克隆,所述第二克隆是指過客克隆,所述第三克隆為不攜帶體細胞突變的集合;
步驟S4中,基于增強學習算法建立所述亞克隆預測模型;所述增強學習算法選自AdaBoost算法;用AdaBoost算法,將已知體細胞突變信息的各個樣本的突變的基因位點的注釋信息轉化合并成一個文件,每行一個樣本,形成一個輸入的特征集文件;將所述輸入的特征集文件讀入,以所述突變的基因位點屬于第一克隆,第二克隆和第三克隆的哪一類作為目標值,以所述特征集文件中的注釋信息作為特征進行增強學習模型的擬合,利用cross-validation得到最優的參數,得到亞克隆預測模型。
2.如權利要求1所述的無對照體細胞突變檢測方法,其特征在于,還包括以下特征中的一項或多項:
a.步驟S2中,所述聚類算法選自K-Means聚類算法;
b.步驟S3中,注釋信息選自突變的人群分布信息,癌種特異的突變分布信息和突變功能信息中的一種或多種。
3.如權利要求2所述的無對照體細胞突變檢測方法,其特征在于:
步驟S1中,獲取待測樣本的突變基因位點的檢測數據的方法包括如下步驟:
1)測序下機數據通過BCL2fastq軟件,利用樣本的標簽序列信息從測序BCL數據中分離樣本數據并轉換成fastq文件;
2)fastq文件通過BWA算法比對到人類參考基因組得到記錄比對信息的SAM文件,并利用samtools軟件轉換為BAM 文件;
3)使用varscan2算法鑒別出樣本的突變和拷貝數變異,得到樣本的突變信息和拷貝數變異信息,即突變基因位點的檢測數據。
4.一種無對照體細胞突變檢測裝置,其特征在于,所述裝置無需正常組織對照,所述裝置至少包括:
獲取模塊,用于獲取待測樣本的突變基因位點的檢測數據,所述突變基因位點的檢測數據包括堿基置換突變信息和拷貝數變異信息;
分層模塊,用于根據所述突變基因位點的檢測數據信息,基于聚類算法對突變基因位點進行相似聚類,即形成亞克隆分層;
注釋模塊,用于注釋各亞克隆內各突變基因位點;
建模模塊,用于建立亞克隆預測模型;
預測模塊,用于將注釋模塊得到的各亞克隆內各突變基因位點注釋信息輸入到所述亞克隆預測模型中,預測各亞克隆屬于第一克隆,第二克隆和第三克隆中的哪一類;所述第一克隆是指腫瘤的驅動克隆,所述第二克隆是指過客克隆,所述第三克隆為不攜帶體細胞突變的集合;
建模模塊中,基于增強學習算法建立所述亞克隆預測模型;所述增強學習算法選自AdaBoost算法;用AdaBoost算法,將已知體細胞突變信息的各個樣本的突變的基因位點的注釋信息轉化合并成一個文件,每行一個樣本,形成一個輸入的特征集文件;將所述輸入的特征集文件讀入,以所述突變的基因位點屬于第一克隆,第二克隆和第三克隆的哪一類作為目標值,以所述特征集文件中的注釋信息作為特征進行增強學習模型進行增強學習模型的擬合,利用cross-validation得到最優的參數,得到亞克隆預測模型。
5.如權利要求4所述的無對照體細胞突變檢測裝置,其特征在于,還包括以下特征中的一項或多項:
a.分層模塊中,所述聚類算法選自K-Means聚類算法;
b.注釋模塊中,注釋信息選自突變的人群分布信息,癌種特異的突變分布信息和突變功能信息中的一種或多種。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于慧算醫療科技(上海)有限公司,未經慧算醫療科技(上海)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910395409.0/1.html,轉載請聲明來源鉆瓜專利網。





