[發明專利]一種基于深度混合網絡的單細胞轉錄組缺失值填補方法有效
| 申請號: | 201911072613.5 | 申請日: | 2019-11-05 |
| 公開(公告)號: | CN110957009B | 公開(公告)日: | 2023-05-12 |
| 發明(設計)人: | 何堯;謝志;袁皓 | 申請(專利權)人: | 中山大學中山眼科中心 |
| 主分類號: | G16B40/00 | 分類號: | G16B40/00 |
| 代理公司: | 廣州粵高專利商標代理有限公司 44102 | 代理人: | 林麗明 |
| 地址: | 510060 廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 深度 混合 網絡 單細胞 轉錄 缺失 填補 方法 | ||
1.一種基于深度混合網絡的單細胞轉錄組缺失值填補方法,其特征在于,包括以下步驟:
S1:對單細胞測序并進行預處理,得到表達矩陣;
S2:將表達矩陣進行標準化處理得到初始表達矩陣;
S3:構建基于深度學習的混合模型,包括自編碼器和循環神經網絡兩部分;
S4:將初始表達矩陣輸入自編碼器進行降維處理,得到一個降維的特征矩陣和一個重建的表達矩陣;
S5:將降維的特征矩陣輸入循環神經網絡,預測所有基因的表達值,得到對應的預測表達矩陣;
S6:將步驟S5得到的預測表達矩陣作為自編碼器的輸入,重復循環步驟S4、步驟S5,直至到達預設的循環步數,得到多個預測表達矩陣;
S7:計算每一次循環的權重,將多個預測表達矩陣按照對應的權重進行加權平均,輸出的結果作為混合模型的填補輸出,完成對單細胞轉錄組缺失值的填補;
所述步驟S2具體為:
表達矩陣根據每個細胞的文庫大小ls進行標準化,消除文庫大小的影響,其中,對于細胞c的基因表達值向量Cc的標準化的公式為:
其中,sf表示所有細胞標準化后的文庫大小,對表達矩陣內所有細胞進行標準化操作,以每個基因的最大表達值為標準,調整取值范圍到0-1;
所述混合模型的應用過程中,采用非阻塞多進程分塊隨機讀取數據的方法將單細胞數據輸入混合模型;具體過程為:
輸入單細胞數據文件的存儲地址,該文件滿足存取矩陣并進行分塊讀取的任意類型;
根據存儲地址,讀取文件所存儲的單細胞轉錄組矩陣的維度信息,包括細胞數目和基因數目,并輸入對應的細胞名稱,基因名稱;
將所有細胞按順序劃分成多個數據簇,并為每個數據簇標記上序號,所有簇序號作為一個序號池;
根據序號池建立一個副本,每次不放回地隨機抽取一定個數的簇序號,抽取出數據集合,若該副本數據抽取完畢則重新建立副本進行抽取;
程序啟動處理子進程對抽取得到的數據集合進行處理;子進程的數目為任意個,每個啟動的子進程的啟動順序及處理內容會被記錄,確保處理結果準確地發送至準確的混合模型輸入管道中。
2.根據權利要求1所述的一種基于深度混合網絡的單細胞轉錄組缺失值填補方法,其特征在于,所述步驟S1具體包括以下步驟:
S11:采用現有的建庫方法獲取處理后細胞,進行測序得到序列數據,文件格式,如Fastq;
S12:利用映射軟件,如Tophat2,對序列數據進行映射;
S13:采用數據分用軟件,如UMI-tools,對映射后的序列數據按細胞進行劃分,得到序列分用數據;
S14:利用定量軟件,如FeatureCounts,將映射并分用后的結果進行定量,得到一個基因×細胞的表達矩陣。
3.根據權利要求1所述的一種基于深度混合網絡的單細胞轉錄組缺失值填補方法,其特征在于,在所述步驟S3中,所述自編碼器包括編碼器和解碼器;所述編碼器用于表達矩陣的降維處理,得到降維后的特征矩陣;所述解碼器用于解碼重建出新的表達矩陣。
4.根據權利要求3所述的一種基于深度混合網絡的單細胞轉錄組缺失值填補方法,其特征在于,在所述步驟S3中,所述循環神經網絡包括預測陣列和過濾器;其中:
所述預測陣列將所述自編碼器得到的降維后的特征矩陣作為輸入,預測所有基因的表達值,得到預測的表達矩陣;所述過濾器將預測的表達矩陣進行過濾,得到下一個循環神經網絡輸入。
5.根據權利要求4所述的一種基于深度混合網絡的單細胞轉錄組缺失值填補方法,其特征在于,所述自編碼器為單層隱藏層結構;所述預測陣列包含M個通道,每個通道對應一個基因m(1≤m≤M),每個通道包含四層結構,包括輸入層,第一隱藏層、第二隱藏層和輸出層;其中:
所述輸入層用于輸入降維后的特征矩陣;所述第一隱藏層用于計算所述循環神經網絡每一個循環的權重,用于所述步驟S7中;所述第二隱藏層的輸出結果用于計算所述輸出層上每個通道的權重;所述輸出層用于輸出最終的填補輸出。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中山大學中山眼科中心,未經中山大學中山眼科中心許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911072613.5/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:遠程串口調試系統及方法
- 下一篇:一種楊梅蜜餞的生產工藝





