[發(fā)明專利]基于對(duì)抗自動(dòng)編碼器的單細(xì)胞RNA測(cè)序聚類方法在審
| 申請(qǐng)?zhí)枺?/td> | 202010723087.0 | 申請(qǐng)日: | 2020-07-24 |
| 公開(公告)號(hào): | CN111785329A | 公開(公告)日: | 2020-10-16 |
| 發(fā)明(設(shè)計(jì))人: | 郭延明;武與倫;肖延?xùn)|;老松楊 | 申請(qǐng)(專利權(quán))人: | 中國(guó)人民解放軍國(guó)防科技大學(xué) |
| 主分類號(hào): | G16B30/10 | 分類號(hào): | G16B30/10;G16B30/20;G16B40/30;G06K9/62 |
| 代理公司: | 北京風(fēng)雅頌專利代理有限公司 11403 | 代理人: | 李博瀚 |
| 地址: | 410003 湖*** | 國(guó)省代碼: | 湖南;43 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 對(duì)抗 自動(dòng) 編碼器 單細(xì)胞 rna 測(cè)序聚類 方法 | ||
1.一種基于對(duì)抗自動(dòng)編碼器的單細(xì)胞RNA測(cè)序聚類方法,其特征在于,包括:
利用基于深度技術(shù)自動(dòng)編碼器方法的零膨脹負(fù)二項(xiàng)分布特定損失函數(shù)對(duì)輸入的數(shù)據(jù)進(jìn)行數(shù)據(jù)重建,得到無噪音數(shù)據(jù),并構(gòu)建一個(gè)由編碼器,中間隱藏層和解碼器三部分構(gòu)成的自動(dòng)編碼器框架,利用自動(dòng)編碼器的中間隱藏層中學(xué)習(xí)到隱藏層特征向量;
利用對(duì)抗自編碼器對(duì)隱藏層特征向量的先驗(yàn)分布進(jìn)行約束,將隱藏層特征向量的聚合后驗(yàn)與先驗(yàn)分布進(jìn)行匹配;
使用負(fù)二項(xiàng)分布特定損失函數(shù)作為重建損失函數(shù),并使用改進(jìn)深度嵌入聚類進(jìn)行聚類,計(jì)算聚類損失;
聯(lián)合優(yōu)化約束特征的重建損失和聚類損失,迭代地更新聚類標(biāo)簽分配。
2.根據(jù)權(quán)利要求1所述的基于對(duì)抗自動(dòng)編碼器的單細(xì)胞RNA測(cè)序聚類方法,其特征在于,所述利用基于深度技術(shù)自動(dòng)編碼器方法的零膨脹負(fù)二項(xiàng)式分布損失函數(shù)對(duì)輸入的數(shù)據(jù)進(jìn)行數(shù)據(jù)重建,得到無噪音數(shù)據(jù)包括,
通過負(fù)二項(xiàng)式分布的均值和離散度以及代表數(shù)據(jù)缺失概率的附加系數(shù)估算零膨脹負(fù)二項(xiàng)式分布損失函數(shù):
ZINB(X|π,μ,θ)=πδ0(X)+(1-π)NB(X|μ,θ)
其中μ表示負(fù)二項(xiàng)式分布的均值,θ表示離散度,π表示數(shù)據(jù)缺失概率的附加系數(shù),ZINB表示零膨脹負(fù)二項(xiàng)式分布損失函數(shù);
將零膨脹負(fù)二項(xiàng)式分布損失函數(shù)作為重建損失函數(shù)對(duì)輸入的數(shù)據(jù)進(jìn)行數(shù)據(jù)重建,得到無噪音數(shù)據(jù)。
3.根據(jù)權(quán)利要求1所述的基于對(duì)抗自動(dòng)編碼器的單細(xì)胞RNA測(cè)序聚類方法,其特征在于,所述利用對(duì)抗自編碼器對(duì)隱藏層特征向量的先驗(yàn)分布進(jìn)行約束包括:
在自動(dòng)編碼器的中間隱藏層頂部添加一個(gè)判別器,將自動(dòng)編碼器修改為對(duì)抗自編碼器;
將編碼器函數(shù)和解碼器函數(shù)分別定義為和其中Z表示隱藏層的特征,權(quán)重WE和WD分別是編碼器和解碼器中的待學(xué)習(xí)參數(shù);
將自動(dòng)編碼器中間隱藏層的潛在特征和來自先驗(yàn)分布的一組相同維度大小的真實(shí)樣本輸入判別器,利用二進(jìn)制交叉熵?fù)p失來訓(xùn)練和更新參數(shù),其中Ld代表判別器的損失函數(shù):
將自動(dòng)編碼器作為生成器進(jìn)行訓(xùn)練,以混淆判別器,并讓判別器判斷編碼器生成的輸入樣本為真實(shí)樣本;
其中Lg代表判別器的損失函數(shù),zi表示真實(shí)樣本,D表示判別器,Si表示自動(dòng)編碼器中間隱藏層的潛在特征。
4.根據(jù)權(quán)利要求3所述的基于對(duì)抗自動(dòng)編碼器的單細(xì)胞RNA測(cè)序聚類方法,其特征在于,在利用二進(jìn)制交叉熵?fù)p失來訓(xùn)練和更新參數(shù)之前,所述方法還包括:
將零均值高斯隨機(jī)噪聲添加到編碼器的每一層,使模型更健壯。
5.根據(jù)權(quán)利要求1所述的基于對(duì)抗自動(dòng)編碼器的單細(xì)胞RNA測(cè)序聚類方法,其特征在于,所述使用負(fù)二項(xiàng)分布特定損失函數(shù)作為重建損失函數(shù),并使用IDEC進(jìn)行聚類,計(jì)算聚類損失包括:
將解碼器的最后一層替換為三個(gè)獨(dú)立的全連接層,且三個(gè)獨(dú)立的全連接層的維度與輸入數(shù)據(jù)相同,解碼器的架構(gòu)為:
De=GWD(H)
Φ=sigmoid(WπDe)
Θ=exp(WθDe)
其中,H表示瓶頸層的輸出,WM,Wπ和Wθ分別代表最后三個(gè)全連接層中的待學(xué)習(xí)參數(shù),尺度因子sf是一個(gè)獨(dú)立的生物學(xué)變量,由原始數(shù)據(jù)的庫(kù)大小和細(xì)胞中位數(shù)計(jì)算得出;
ZINB分布的重建損失函數(shù)是ZINB分布的負(fù)對(duì)數(shù)變換
Lr=-log(ZINB(X|π,μ,θ))
在輔助目標(biāo)分布P和樣本特征中軟聚類標(biāo)簽的分布Q之間的KL散度計(jì)算得到聚類損失,
6.根據(jù)權(quán)利要求1所述的基于對(duì)抗自動(dòng)編碼器的單細(xì)胞RNA測(cè)序聚類方法,其特征在于,所述包括:
聯(lián)合優(yōu)化約束特征的重建損失和聚類損失,迭代地更新聚類標(biāo)簽分配,
模型的目標(biāo)函數(shù)定義為
L1=Lr+Lg
相對(duì)于聚類中心μj和隱藏層特征樣本zi的Lc的梯度計(jì)算如下
在聚類過程中,聚類中心μj通過以下方式更新
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國(guó)人民解放軍國(guó)防科技大學(xué),未經(jīng)中國(guó)人民解放軍國(guó)防科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010723087.0/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 農(nóng)業(yè)信息對(duì)抗資源目標(biāo)規(guī)劃最優(yōu)分配方法
- 農(nóng)業(yè)信息對(duì)抗資源模糊規(guī)劃最優(yōu)分配方法
- 農(nóng)業(yè)信息對(duì)抗資源線性規(guī)劃最優(yōu)分配方法
- 基于聚類數(shù)據(jù)挖掘的對(duì)抗行為搜索算法
- 面向多種對(duì)抗圖片攻擊的協(xié)同免疫防御方法
- 一種自適應(yīng)對(duì)抗強(qiáng)度的對(duì)抗訓(xùn)練方法
- 對(duì)抗攻擊模型的訓(xùn)練方法及裝置
- 對(duì)抗樣本的生成方法和裝置
- 多樣本對(duì)抗擾動(dòng)生成方法、裝置、存儲(chǔ)介質(zhì)和計(jì)算設(shè)備
- 一種無人集群協(xié)同博弈對(duì)抗的控制方法及系統(tǒng)





