[發(fā)明專利]用于識(shí)別引起序列特異性錯(cuò)誤(SSE)的序列圖案的基于深度學(xué)習(xí)的框架在審
| 申請(qǐng)?zhí)枺?/td> | 201980003258.8 | 申請(qǐng)日: | 2019-07-09 |
| 公開(公告)號(hào): | CN110892484A | 公開(公告)日: | 2020-03-17 |
| 發(fā)明(設(shè)計(jì))人: | D·卡什夫哈吉;A·起亞;K-H·法爾 | 申請(qǐng)(專利權(quán))人: | 因美納有限公司 |
| 主分類號(hào): | G16B40/20 | 分類號(hào): | G16B40/20;G16B20/20;G06N3/04 |
| 代理公司: | 北京泛華偉業(yè)知識(shí)產(chǎn)權(quán)代理有限公司 11280 | 代理人: | 王勇 |
| 地址: | 美國加利*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 用于 識(shí)別 引起 序列 特異性 錯(cuò)誤 sse 圖案 基于 深度 學(xué)習(xí) 框架 | ||
1.一種用于識(shí)別引起核苷酸測序數(shù)據(jù)中的序列特異性錯(cuò)誤的重復(fù)圖案的系統(tǒng),包括:
一個(gè)或多個(gè)處理器和存儲(chǔ)指令的一個(gè)或多個(gè)存儲(chǔ)裝置,所述指令當(dāng)在所述一個(gè)或多個(gè)處理器上執(zhí)行時(shí)引起所述一個(gè)或多個(gè)處理器實(shí)施:
輸入準(zhǔn)備子系統(tǒng),所述輸入準(zhǔn)備子系統(tǒng)配置成:
將待測重復(fù)圖案以計(jì)算方式重疊于多個(gè)核苷酸序列上并且產(chǎn)生重疊樣品,
其中每個(gè)重復(fù)圖案表示特定核苷酸組成,所述特定核苷酸組成具有特定長度并且在重疊樣品中出現(xiàn)于特定偏移位置,
其中每個(gè)重疊樣品具有視為變體核苷酸的靶位置,并且
其中對(duì)于所述特定核苷酸組成、所述特定長度和所述特定偏移位置的每種組合,以計(jì)算方式生成一組所述重疊樣品;
預(yù)訓(xùn)練變體濾波器子系統(tǒng),所述預(yù)訓(xùn)練變體濾波器子系統(tǒng)配置成:
通過卷積神經(jīng)網(wǎng)絡(luò)處理所述重疊樣品,并且基于所述重疊樣品中的核苷酸圖案通過所述卷積神經(jīng)網(wǎng)絡(luò)的卷積濾波器的檢測,生成每個(gè)所述重疊樣品中的所述變體核苷酸為真實(shí)變體或虛假變體的可能性的分類分?jǐn)?shù);
重復(fù)圖案輸出子系統(tǒng),所述重復(fù)圖案輸出子系統(tǒng)配置成:
輸出所述分類分?jǐn)?shù)的分布,所述分類分?jǐn)?shù)指示由所述重復(fù)圖案的存在所得出的所述預(yù)訓(xùn)練變體濾波器子系統(tǒng)對(duì)于虛假變體分類的敏感性;和
序列特異性錯(cuò)誤關(guān)聯(lián)子系統(tǒng),所述序列特異性錯(cuò)誤關(guān)聯(lián)子系統(tǒng)配置成:
基于閾值而將所述分類分?jǐn)?shù)的子組規(guī)定為指示所述虛假變體分類,以及
將與指示所述虛假變體分類的所述分類分?jǐn)?shù)的所述子組相關(guān)聯(lián)的那些重復(fù)圖案分類為引起所述序列特異性錯(cuò)誤。
2.根據(jù)權(quán)利要求1所述的系統(tǒng),其中所述序列特異性錯(cuò)誤關(guān)聯(lián)子系統(tǒng)還配置成:
將分類為引起所述序列特異性錯(cuò)誤的所述重復(fù)圖案的特定長度和特定偏移位置分類為也引起所述序列特異性錯(cuò)誤。
3.根據(jù)權(quán)利要求1至2中任一項(xiàng)所述的系統(tǒng),其中所述變體核苷酸處于所述靶位置,在每側(cè)側(cè)接至少20個(gè)核苷酸。
4.根據(jù)權(quán)利要求1至3中任一項(xiàng)所述的系統(tǒng),其中所述預(yù)訓(xùn)練變體濾波器子系統(tǒng)配置成處理在至少100個(gè)重疊樣品中的至少100個(gè)核苷酸序列上所重疊的所述重復(fù)圖案的每種組合。
5.根據(jù)權(quán)利要求1至4中任一項(xiàng)所述的系統(tǒng),其中所述重復(fù)圖案包括來自具有至少6個(gè)重復(fù)因子的四個(gè)堿基(A、C、G和T)的至少一個(gè)堿基。
6.根據(jù)權(quán)利要求5所述的系統(tǒng),其中所述重復(fù)圖案為具有所述至少6個(gè)重復(fù)因子的單個(gè)堿基(A、C、G或T)的均聚物;并且
其中所述至少6個(gè)重復(fù)因子規(guī)定所述重復(fù)圖案中所述單個(gè)堿基的重復(fù)次數(shù)。
7.根據(jù)權(quán)利要求1至6中任一項(xiàng)所述的系統(tǒng),其中所述重復(fù)圖案為來自具有所述至少6個(gè)重復(fù)因子的四個(gè)堿基(A、C、G和T)的至少兩個(gè)堿基的共聚物;并且
其中所述至少6個(gè)重復(fù)因子規(guī)定所述重復(fù)圖案中所述至少兩個(gè)堿基的重復(fù)次數(shù)。
8.根據(jù)權(quán)利要求1至7中任一項(xiàng)所述的系統(tǒng),其中所述偏移位置關(guān)于所述重復(fù)圖案重疊于所述核苷酸序列上的位置而改變,可測量為所述重復(fù)圖案的原點(diǎn)位置和所述核苷酸序列的原點(diǎn)位置之間的偏移量,并且至少十個(gè)偏移量用于產(chǎn)生所述重疊樣品。
9.根據(jù)權(quán)利要求1至8中任一項(xiàng)所述的系統(tǒng),其中所述重復(fù)圖案處于所述重疊樣品中的中心核苷酸的右側(cè)并且不與所述中心核苷酸重疊。
10.根據(jù)權(quán)利要求1至9中任一項(xiàng)所述的系統(tǒng),其中所述重復(fù)圖案處于所述重疊樣品中的中心核苷酸的左側(cè)并且不與所述中心核苷酸重疊。
11.根據(jù)權(quán)利要求1至10中任一項(xiàng)所述的系統(tǒng),其中所述重復(fù)圖案包括所述重疊樣品中的中心核苷酸。
12.根據(jù)權(quán)利要求1至11中任一項(xiàng)所述的系統(tǒng),其中所述重復(fù)因子為5至所述重疊樣品中的核苷酸計(jì)數(shù)的四分之一的范圍內(nèi)的整數(shù)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于因美納有限公司,未經(jīng)因美納有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201980003258.8/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 識(shí)別媒體、識(shí)別媒體的識(shí)別方法、識(shí)別對(duì)象物品以及識(shí)別裝置
- 一種探針卡識(shí)別裝置和方法
- 識(shí)別裝置、識(shí)別方法以及記錄介質(zhì)
- 識(shí)別裝置、識(shí)別系統(tǒng),識(shí)別方法以及存儲(chǔ)介質(zhì)
- 識(shí)別程序、識(shí)別方法以及識(shí)別裝置
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 識(shí)別裝置、識(shí)別方法以及識(shí)別程序
- 識(shí)別裝置、識(shí)別方法及識(shí)別程序





