[發明專利]一種利用共識性預測結果識別癌癥驅動基因的方法在審
| 申請號: | 202110910593.5 | 申請日: | 2021-08-09 |
| 公開(公告)號: | CN113611363A | 公開(公告)日: | 2021-11-05 |
| 發明(設計)人: | 韋嘉;葉翔赟;吳金波 | 申請(專利權)人: | 上海基緒康生物科技有限公司 |
| 主分類號: | G16B20/50 | 分類號: | G16B20/50;G16B45/00;G16B40/00 |
| 代理公司: | 武漢智新達知識產權代理事務所(特殊普通合伙) 42272 | 代理人: | 謝厚霓 |
| 地址: | 200000 上海市浦東新區*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 利用 共識 預測 結果 識別 癌癥 驅動 基因 方法 | ||
1.一種利用共識性預測結果識別癌癥驅動基因的方法,其特征在于,包括以下步驟:
S1、接受突變注釋格式(MAF)文件作為輸入;
S2、處理所有預處理的輸入突變數據,以分別獲得每種策略的候選驅動基因列表;
S3、基于每個差異驅動基因列表,使用秩集成方法RobustRankAggreg來獲得共有驅動基因列表;
S4、使用Top-N-Precision和Top-N-nDCG評估結果性能,最后,還對共有驅動基因進行了KEGG途徑和基因本體分析,以進行全面注釋;
S5、利用RAA算法獲得共識驅動基因列表,該列表匯總了各個工具預測的排名驅動基因;
S6、應用SuperExactTest和Circos來組織可視化結果。
2.根據權利要求1所述的一種利用共識性預測結果識別癌癥驅動基因的方法,其特征在于,所述MAF文件是從變量調用格式(VCF)文件進行批注的,可以通過使用變量調用工具(如Mutect)在NGS數據上獲取該文件。
3.根據權利要求1所述的一種利用共識性預測結果識別癌癥驅動基因的方法,其特征在于,在步驟S2中,使用SuperExactTest模型來評估使用所有蛋白質編碼基因作為整個背景基因集的單個調用結果的交集的統計顯著性。
4.根據權利要求1所述的一種利用共識性預測結果識別癌癥驅動基因的方法,其特征在于,在步驟S3中使用了四個數據庫,其分別為:
A、癌癥基因普查(CGC);
B、整合癌基因組學(IntOGen);
C、癌癥基因網絡(NCG);
D、在線人類孟德爾遺傳(OMIM)用于注釋所預測的驅動基因。
5.根據權利要求4所述的一種利用共識性預測結果識別癌癥驅動基因的方法,其特征在于,所述Top-N-Precision是基于CGC癌癥數據庫的前100個基因,根據方程式(1)評估了先前策略獲得的結果中的精確性,方程式(1)如下:
同時,SUM(精確度)代表27種癌癥類型各自的精確度得分之和,見方程式(2):
此外,使用IntOGen作為驅動基因參考數據集,利用歸一化折現累積收益(nDCG)這一參數來衡量排序結果的質量,其次,獲得Top-N-nDCG的結果通過以下步驟:
1)首先下載IntOGen癌癥驅動基因數據集;
2)利用公式(3)根據參考基因的比例和驅動突變的數量為其分配權重;
3)根據公式(4)得到與基準IntOGen數據集重疊的預測驅動基因的權重;
4)在基準IntOGen數據集上不存在的預測基因的權重設置為0,可以通過等式(4)、(5)、(6)和(7)來計算Top-N-nDCG;
公式(3)、(4)、(5)、(6)和(7)如下:
CGn=SUM(前n個預測基因權重) (5)
IDCGn=DCGn(IntOGen中排序) (7)
其中,n表示前n個排名最高的預測基因,i表示預測基因的排名,CGn表示前n個預測基因的累積權重,DCGn表示CGn與折扣因子1/log2i(i>1)的乘積,IDCGn表示理想條件下的DCGn,即預測排名與參考數據集排名一致,Top-N-nDCG代表標準化的DCGn,并測量預測基因的排名表現。
6.根據權利要求5所述的一種利用共識性預測結果識別癌癥驅動基因的方法,其特征在于,所述SuperExactTest是可擴展的可視化工具,用于說明Venn圖之外的多組之間的高階關系,它評估了每種工具的重疊部分,并給出了一個圓形圖,說明了使用,統計方法的所有可能的交點,所述Circos直觀地可視化了預測的驅動基因組。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海基緒康生物科技有限公司,未經上海基緒康生物科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110910593.5/1.html,轉載請聲明來源鉆瓜專利網。





