[發(fā)明專利]預(yù)測腫瘤新生抗原的方法、裝置及存儲(chǔ)介質(zhì)有效
| 申請?zhí)枺?/td> | 201811531729.6 | 申請日: | 2018-12-14 |
| 公開(公告)號(hào): | CN109584960B | 公開(公告)日: | 2021-07-30 |
| 發(fā)明(設(shè)計(jì))人: | 葉浩;李祥永;戴珩 | 申請(專利權(quán))人: | 序康醫(yī)療科技(蘇州)有限公司 |
| 主分類號(hào): | G16B20/50 | 分類號(hào): | G16B20/50;G16B50/00 |
| 代理公司: | 上海智信專利代理有限公司 31002 | 代理人: | 王潔;豆欣欣 |
| 地址: | 215123 江蘇省蘇州市蘇州工*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 預(yù)測 腫瘤 新生 抗原 方法 裝置 存儲(chǔ) 介質(zhì) | ||
1.一種預(yù)測腫瘤新生抗原的方法,其特征在于,所述的方法包括步驟:
(1)根據(jù)腫瘤-胚系對照樣本進(jìn)行體細(xì)胞突變以及基因融合檢測;
(2)針對每一對融合基因生成融合肽及相應(yīng)野生肽;
(3)基于每個(gè)體細(xì)胞突變生成單突變肽及相應(yīng)野生肽;
(4)構(gòu)建腫瘤樣本特異的個(gè)人基因組并生成含有多個(gè)突變的多突變肽;
(5)通過突變間的順式反式關(guān)系,判斷單突變以及多突變的突變肽真?zhèn)危烧鎸?shí)存在的突變肽;
(6)去除與野生型蛋白其它位置序列完全一致的突變肽,構(gòu)建完整的新生多肽庫;
(7)基于胚系對照樣本的bam文件進(jìn)行HLA分子分型檢測,預(yù)測新生多肽與HLA分子的親和力,將親和力高的新生多肽作為候選腫瘤新生抗原;
在所述的步驟(2)中,融合斷點(diǎn)注釋,采用AGFusion工具根據(jù)5’端、3’端斷點(diǎn)在基因組上的坐標(biāo)信息,注釋融合斷點(diǎn),并生成融合后的蛋白序列全長;截取長度為L且含有融合斷點(diǎn)的融合肽以及對應(yīng)的5’端、3’端野生肽,具體的截取規(guī)則為:
確定5’端融合斷點(diǎn)在長度為p5的5’端野生蛋白以及長度為g的融合蛋白上的坐標(biāo)索引:比對融合蛋白與5’端野生蛋白序列,得出最大的一致性片段序列seq1、以及seq1的5’端野生蛋白上的坐標(biāo)索引m、融合蛋白上的坐標(biāo)索引t,所述的seq1的長度為s1,則5’端斷點(diǎn)的坐標(biāo)索引在野生型蛋白上為m+s1,在融合蛋白上為t+s1;
確定3’端融合斷點(diǎn)在長度為p3的3’端野生蛋白上的坐標(biāo)索引:比對融合蛋白與3’端野生蛋白,得出最大一致性片段序列seq2以及seq2在3’端野生蛋白上的坐標(biāo)索引n,所述的seq2的長度為s2;
截取長度為L的融合肽以及相應(yīng)5’和3’端野生肽:
在3’端融合斷點(diǎn)不造成移碼框改變的情況下,每一條融合肽均有相對5’端以及3’端兩條野生肽生成,融合蛋白從最小坐標(biāo)索引t+s1-L到最大坐標(biāo)索引t,截取長度為L的融合肽;5’端野生蛋白從最小坐標(biāo)索引m+s1-L到最大坐索引m,3’端野生蛋白從n-L到最大坐標(biāo)索引n,截取長度為L的兩條相應(yīng)的野生肽;
當(dāng)3’端融合斷點(diǎn)造成移碼框改變時(shí),每一條融合肽只有一條5’端野生肽生成,融合蛋白從最小坐標(biāo)索引t+s1-L到最大坐標(biāo)索引g-L,截取長度為L的融合肽,5’端野生蛋白從最小坐標(biāo)索引m+s1-L到最大坐標(biāo)索引p5-L,順序生成相應(yīng)長度為L的野生肽。
2.根據(jù)權(quán)利要求1所述的預(yù)測腫瘤新生抗原的方法,其特征在于,所述的步驟(1)的中:
對于體細(xì)胞突變,在Mutect2工具的默認(rèn)參數(shù)下輸出體細(xì)胞突變結(jié)果之后,進(jìn)行進(jìn)一步質(zhì)控過濾,所述的質(zhì)控過濾包括:突變頻率大于2%;突變點(diǎn)的測序深度大于10;至少有2條reads指示有突變且該reads的平均堿基質(zhì)量20;
對于基因融合檢測,若輸入為全外顯子WES或全基因組WGS測序數(shù)據(jù),則用FACTERA工具在默認(rèn)參數(shù)下檢測基因融合;若輸入為RNAseq數(shù)據(jù),則用STAR-Fusion工具在默認(rèn)參數(shù)下檢測基因融合,然后通過junction reads數(shù)目≥1,做進(jìn)一步的質(zhì)控以減少假陽性,該junction reads指為直接覆蓋融合斷點(diǎn)的reads。
3.根據(jù)權(quán)利要求1所述的預(yù)測腫瘤新生抗原的方法,其特征在于,所述的步驟(3)中,
使用SnpEff注釋,將每一個(gè)體細(xì)胞基因組上的堿基突變注釋到Ensembel數(shù)據(jù)庫上的每一個(gè)轉(zhuǎn)錄本以及相應(yīng)蛋白序列上;
截取長度為L的突變肽以及相應(yīng)的野生肽。
4.根據(jù)權(quán)利要求3所述的預(yù)測腫瘤新生抗原的方法,其特征在于,截取規(guī)則為:
對于錯(cuò)義突變、非移碼突變,以突變坐標(biāo)為中心,向5’端取L-1個(gè)氨基酸,向3’端取L-1個(gè)氨基酸,生成長度為8~11個(gè)氨基酸長度以及13~25個(gè)氨基酸長度之間的含有突變氨基酸的突變段以及相應(yīng)野生肽;
對于典型單點(diǎn)突變,生成38對長度為8~11個(gè)氨基酸長度的突變型-野生型肽段,以及247對長度為13~25個(gè)氨基酸長度的突變型-野生型肽段;
對于移碼突變,從突變點(diǎn)的前L-1個(gè)氨基酸開始,延伸到第一個(gè)終止子出現(xiàn)為止,生成8~11以及13~25氨基酸長度的突變肽段及相應(yīng)坐標(biāo)的野生肽段。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于序康醫(yī)療科技(蘇州)有限公司,未經(jīng)序康醫(yī)療科技(蘇州)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811531729.6/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法、程序以及記錄介質(zhì)
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 基于時(shí)間序列預(yù)測模型適用性量化的預(yù)測模型選擇方法
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 分類預(yù)測方法及裝置、預(yù)測模型訓(xùn)練方法及裝置
- 幀內(nèi)預(yù)測的方法及裝置
- 圖像預(yù)測方法及裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 文本預(yù)測方法、裝置以及電子設(shè)備
- 模型融合方法、預(yù)測方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





