[發明專利]基于對抗自動編碼器的單細胞RNA測序聚類方法在審
| 申請號: | 202010723087.0 | 申請日: | 2020-07-24 |
| 公開(公告)號: | CN111785329A | 公開(公告)日: | 2020-10-16 |
| 發明(設計)人: | 郭延明;武與倫;肖延東;老松楊 | 申請(專利權)人: | 中國人民解放軍國防科技大學 |
| 主分類號: | G16B30/10 | 分類號: | G16B30/10;G16B30/20;G16B40/30;G06K9/62 |
| 代理公司: | 北京風雅頌專利代理有限公司 11403 | 代理人: | 李博瀚 |
| 地址: | 410003 湖*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 對抗 自動 編碼器 單細胞 rna 測序聚類 方法 | ||
本說明書一個或多個實施例提供基于對抗自動編碼器的單細胞RNA測序聚類方法,綜合了特定生物噪聲建模,變異推斷和深度聚類建模的優勢。我們的模型約束了數據結構,并通過AAE模塊進行聚類分析。在三個真實的scRNA?seq數據集上進行的實驗表明,與最新技術在聚類準確度,標準化互信息和調整蘭德系數上相比,本方法的聚類性能都要好得多。
技術領域
本說明書一個或多個實施例涉及RNA測序技術領域,尤其涉及一種基于對抗自動編碼器的單細胞RNA測序聚類方法。
背景技術
單細胞RNA測序(scRNA-seq)技術的進步使其能通過提供比常用批量RNA測序更高的分辨率的轉錄組個體細胞差異解決方案,徹底改變了轉錄組學研究。該技術使研究人員能夠系統地研究細胞異質性,細胞發育軌跡以及跨大量細胞的腫瘤亞群的分類,而無監督聚類是分析scRNA-seq以實現上述任務的重要步驟。只有在聚類后,才能識別細胞類型,之后研究人員才能進一步描繪細胞功能狀態并推斷潛在的細胞動力學。
盡管聚類是傳統的機器學習研究的領域之一,并且已經有一些代表性的方法,例如k均值和譜聚類等,但是由于scRNA-seq原始數據中的基因表達值的缺失,對這種數據的聚類分析仍然是一個挑戰。這種數據缺失指的是存在一些錯誤的零計數,這可能是由于低測序深度和其他技術中的噪音或技術水平限制從而導致基因計數矩陣中沒有記錄的數據。如圖1所示,不同的熱力圖顏色表示不同的基因表達水平(基因計數矩陣中的值)。顯然,細胞中的大多數基因表達水平非常低,只有少數基因表達超過0。因此,這種缺失使scRNA-seq數據非常稀疏,讓傳統的聚類方法無法很好地處理該數據。為了緩解這個問題,當前已經提出了幾種針對scRNA-seq數據的特定聚類算法,包括SNN-Clip,SIMLR和MPSSC。但是,它們在大型數據集上的計算成本很高,并且聚類性能仍然較差。
發明內容
有鑒于此,本說明書一個或多個實施例的目的在于提出一種基于對抗自動編碼器的單細胞RNA測序聚類方法,以解決聚類性能較差的問題。
基于上述目的,本說明書一個或多個實施例提供了一種基于對抗自動編碼器的單細胞RNA測序聚類方法,包括以下步驟:
利用基于深度技術自動編碼器方法的零膨脹負二項分布特定損失函數對輸入的數據進行數據重建,得到無噪音數據,并構建一個由編碼器,中間隱藏層和解碼器三部分構成的自動編碼器框架,利用自動編碼器的中間隱藏層中學習到隱藏層特征向量;
利用對抗自編碼器對隱藏層特征向量的先驗分布進行約束,將隱藏層特征向量的聚合后驗與先驗分布進行匹配;
使用負二項分布特定損失函數作為重建損失函數,并使用改進深度嵌入聚類進行聚類,計算聚類損失;
聯合優化約束特征的重建損失和聚類損失,迭代地更新聚類標簽分配。
優選地,利用基于深度技術自動編碼器方法的零膨脹負二項式分布損失函數對輸入的數據進行數據重建,得到無噪音數據包括,
通過負二項式分布的均值和離散度以及代表數據缺失概率的附加系數估算零膨脹負二項式分布損失函數:
ZINB(X|π,μ,θ)=πδ0(X)+(1-π)NB(X|μ,θ)
其中μ表示負二項式分布的均值,θ表示離散度,π表示數據缺失概率的附加系數,ZINB表示零膨脹負二項式分布損失函數;
將零膨脹負二項式分布損失函數作為重建損失函數對輸入的數據進行數據重建,得到無噪音數據。
優選地,利用對抗自編碼器對隱藏層特征向量的先驗分布進行約束包括:
在自動編碼器的中間隱藏層頂部添加一個判別器,將自動編碼器修改為對抗自編碼器;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國人民解放軍國防科技大學,未經中國人民解放軍國防科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010723087.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:可自動調節規格的穿刺器
- 下一篇:一種基于深度學習的探地雷達智能反演方法





