[發(fā)明專利]一種基于域?qū)购妥兎滞茢嗟膯渭?xì)胞數(shù)據(jù)整合方法在審
| 申請(qǐng)?zhí)枺?/td> | 202210277775.8 | 申請(qǐng)日: | 2022-03-16 |
| 公開(公告)號(hào): | CN114819056A | 公開(公告)日: | 2022-07-29 |
| 發(fā)明(設(shè)計(jì))人: | 呼加璐;趙芮;尚學(xué)群;鐘源珂 | 申請(qǐng)(專利權(quán))人: | 西北工業(yè)大學(xué) |
| 主分類號(hào): | G06N3/04 | 分類號(hào): | G06N3/04;G06N3/06;G06N3/08;G16B40/20 |
| 代理公司: | 西安凱多思知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 61290 | 代理人: | 劉新瓊 |
| 地址: | 710072 *** | 國(guó)省代碼: | 陜西;61 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 對(duì)抗 推斷 單細(xì)胞 數(shù)據(jù) 整合 方法 | ||
1.一種基于域?qū)购妥兎滞茢嗟膯渭?xì)胞數(shù)據(jù)整合方法,其特征在于步驟如下:
步驟1:需要整合的、從不同的單細(xì)胞測(cè)序數(shù)據(jù)集中收集到的標(biāo)準(zhǔn)化的基因表達(dá)矩陣輸入到模型中;所述的模型由一個(gè)特征提取器、一個(gè)非線性函數(shù)映射和一個(gè)域分類器組成;所述特征提取器部分使用KL正則化項(xiàng)使變分推斷的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)到單細(xì)胞數(shù)據(jù)的低維特征,即隱變量Z;所述非線性函數(shù)映射部分用于將從特征提取器中學(xué)到的低維特征還原到原始的數(shù)據(jù)分布;所述域分類器通過梯度反轉(zhuǎn)層連接到神經(jīng)網(wǎng)絡(luò)的瓶頸層,使得本模型在提取特征的同時(shí)混淆不同批次數(shù)據(jù)的來源以進(jìn)行批次效應(yīng)的去除;該模型將這三部分融合,共同構(gòu)建了一個(gè)目標(biāo)損失函數(shù);
步驟2:通過最小化目標(biāo)函數(shù),模型輸出可用于下游分析的隱變量Z,即去除批次效應(yīng)的單細(xì)胞低維嵌入特征,完成單細(xì)胞數(shù)據(jù)整合的任務(wù)。
2.根據(jù)權(quán)利要求1所述基于域?qū)购妥兎滞茢嗟膯渭?xì)胞數(shù)據(jù)整合方法,其特征在于:所述的特征提取器是一個(gè)變分推斷的神經(jīng)網(wǎng)絡(luò),輸入n*p的基因表達(dá)矩陣,n為細(xì)胞數(shù),p為基因數(shù),通過三個(gè)全連接層連接,輸出兩個(gè)n*d的低維矩陣,分別表示隱變量Z的后驗(yàn)概率分布的均值和協(xié)方差矩陣;估計(jì)的分布與Z的先驗(yàn)分布的KL散度為損失函數(shù)的第一項(xiàng)。
3.根據(jù)權(quán)利要求1所述基于域?qū)购妥兎滞茢嗟膯渭?xì)胞數(shù)據(jù)整合方法,其特征在于:所述的非線性函數(shù)映射:輸入特征提取器產(chǎn)生的隱變量Z的樣本,經(jīng)過3個(gè)全連接層的轉(zhuǎn)換后,輸出重構(gòu)的表達(dá)矩陣;重構(gòu)誤差為損失函數(shù)的第二項(xiàng)。
4.根據(jù)權(quán)利要求1所述基于域?qū)购妥兎滞茢嗟膯渭?xì)胞數(shù)據(jù)整合方法,其特征在于:所述域分類器:輸入特征提取器產(chǎn)生的隱變量Z的樣本,首先經(jīng)過1個(gè)梯度反轉(zhuǎn)層,然后經(jīng)過2個(gè)全連接層的轉(zhuǎn)換,最后經(jīng)過softmax激活函數(shù)得到分類結(jié)果;分類結(jié)果和批次標(biāo)簽的均方差作為損失函數(shù)的第三項(xiàng)。
5.根據(jù)權(quán)利要求1所述基于域?qū)购妥兎滞茢嗟膯渭?xì)胞數(shù)據(jù)整合方法,其特征在于:所述隱變量Z的先驗(yàn)分布是標(biāo)準(zhǔn)的高斯分布;為了避免變分編碼器不可求導(dǎo),采用重參數(shù)的方法對(duì)隱變量Z進(jìn)行采樣。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于西北工業(yè)大學(xué),未經(jīng)西北工業(yè)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210277775.8/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 農(nóng)業(yè)信息對(duì)抗資源目標(biāo)規(guī)劃最優(yōu)分配方法
- 農(nóng)業(yè)信息對(duì)抗資源模糊規(guī)劃最優(yōu)分配方法
- 農(nóng)業(yè)信息對(duì)抗資源線性規(guī)劃最優(yōu)分配方法
- 基于聚類數(shù)據(jù)挖掘的對(duì)抗行為搜索算法
- 面向多種對(duì)抗圖片攻擊的協(xié)同免疫防御方法
- 一種自適應(yīng)對(duì)抗強(qiáng)度的對(duì)抗訓(xùn)練方法
- 對(duì)抗攻擊模型的訓(xùn)練方法及裝置
- 對(duì)抗樣本的生成方法和裝置
- 多樣本對(duì)抗擾動(dòng)生成方法、裝置、存儲(chǔ)介質(zhì)和計(jì)算設(shè)備
- 一種無人集群協(xié)同博弈對(duì)抗的控制方法及系統(tǒng)
- 單細(xì)胞表現(xiàn)型數(shù)據(jù)庫(kù)系統(tǒng)和搜索引擎
- 活體單細(xì)胞拉曼分析平臺(tái)數(shù)字控制系統(tǒng)和方法
- 單細(xì)胞捕獲轉(zhuǎn)移系統(tǒng)及單細(xì)胞捕獲轉(zhuǎn)移方法
- 高通量單細(xì)胞轉(zhuǎn)錄組與基因突變整合分析方法
- 基于交變滯慣力打印的單細(xì)胞水平相互作用模型構(gòu)建方法
- 單細(xì)胞蛋白生產(chǎn)菌及其應(yīng)用
- miRNA因果調(diào)控網(wǎng)絡(luò)識(shí)別方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 一種單細(xì)胞分選裝置和單細(xì)胞分選方法
- 一種單細(xì)胞培養(yǎng)系統(tǒng)及單細(xì)胞培養(yǎng)方法
- 流體捕獲芯片、單細(xì)胞捕獲轉(zhuǎn)移系統(tǒng)與單細(xì)胞分析方法





