[發明專利]一種基于卷積神經網絡的細胞反卷積預測方法有效
| 申請號: | 202210003514.7 | 申請日: | 2022-01-05 |
| 公開(公告)號: | CN114023387B | 公開(公告)日: | 2022-04-22 |
| 發明(設計)人: | 劉振棟;呂欣榮;戴瓊海;李冬雁;陳曦;楊玉榮;秦夢穎;柏苛;劉芳含;何志強;李曉峰;季向陽;劉燁斌;胡國勝;李國文 | 申請(專利權)人: | 山東建筑大學 |
| 主分類號: | G16B40/00 | 分類號: | G16B40/00;G06N3/04;G06N3/08 |
| 代理公司: | 濟南泉城專利商標事務所 37218 | 代理人: | 李桂存 |
| 地址: | 250101 山東省濟*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 卷積 神經網絡 細胞 預測 方法 | ||
本發明公開了一種基于卷積神經網絡的細胞反卷積預測方法,該方法屬于細胞反卷積預測領域。使用卷積神經網絡技術從單細胞RNA測序數據中推測組織的細胞類型組成比例,與傳統的細胞反卷積算法相比,解決了傳統反卷積需要進行復雜的數據預處理,并需要設計數學算法對單細胞測序數據進行規范化等弊端。本發明設計的卷積神經網絡可以從單細胞RNA測序數據中提取出隱藏特征,并且網絡節點對數據的噪音和誤差具有很高的魯棒性,并充分挖掘了各個基因之間的內在聯系,因而提高了細胞反卷積性能,同時模型是建立在神經網絡的基礎上的,與傳統的線性模型,機器學習等方法相比,模型結構直觀易于理解,并且具有更好的反卷積性能和高度的擴展性。
技術領域
本發明主要涉及基于單細胞RNA測序數據的下游分析領域,主要是關于一種細胞反卷積方法,特別是涉及到一種基于卷積神經網絡的對單細胞RNA測序數據進行細胞反卷積方法。
背景技術
隨著高通量測序技術被廣泛的運用在生物和醫學領域,近年來開發的單細胞RNA測序技術可以對單個細胞進行無偏、可重復、高分辨率和高通量的轉錄分析。傳統的測序技術是基于群體細胞進行測序,反映出的是一群細胞的平均表達值,并不能揭示不同細胞之間的異質性。而單細胞RNA測序技術可以研究單個細胞表達譜,從而避免單個細胞的基因表達值被群體的平均值所掩蓋,以揭示復雜細胞群體的異質性。單細胞RNA測序技術對單個細胞的全部RNA進行提取、逆轉錄、擴增和測序得到單細胞RNA測序數據,對測序數據的分析可以揭示生物組織的細胞構成、發現罕見的細胞群、探究細胞組分的變化等。
細胞反卷積是單細胞RNA測序數據下游分析的一個方面,細胞反卷積即從組織樣本的單細胞RNA測序數據中推斷出該組織存在的細胞類型及比例,這可用于發現新的細胞亞型、討論癌組織的免疫浸潤情況、探究疾病的發病機理等。而傳統反卷積算法存在一些弊端,如使用的數學模型需要添加各種約束來規范模型,模型不夠直觀難以理解。需要進行繁瑣的數據預處理,并對特定細胞類型的基因表達矩陣的準確度及組織的基因表達矩陣的準確度要求都較高。目前機器學習技術在細胞反卷積領域應用的還不夠廣泛,在使用機器學習技術提升細胞反卷積性能上仍具有較大探索空間。針對這些問題,我們急需發展出一種新的細胞反卷積方案來應對較高的生物醫學的數據處理及分析需求。
發明內容
針對現有細胞反卷積算法的缺陷,本發明提供了一種基于卷積神經網絡的細胞反卷積預測方法Cbccon。Cbccon通過使用深度學習技術即卷積神經網絡來進行組織細胞比例預測,Cbccon模型的隱藏節點可以有效的挖掘出基因之間的內部聯系,節點可以學習到對噪音和偏差具有魯棒性的特征,具有更好的反卷積性能。建立Cbccon模型的目的在于解決當前細胞反卷積算法受到噪音和偏差的影響從而導致精度不高,并且需要添加各種約束來規范模型等問題。
為實現上述目的,本發明提供如下技術方案:一種基于卷積神經網絡的細胞反卷積方法,包括以下步驟:
(1)使用單細胞RNA測序數據模擬人工組織,確定一個模擬人工組織中的細胞總數K和需要生成的人工組織個數Q;從單細胞RNA測序數據中抽取K個細胞,合并抽取細胞的基因表達矩陣形成模擬人工組織的基因表達矩陣為模擬組織的特征,并記錄該組織各個類型細胞所占比例作為該組織的標記信息,為某細胞類型占該組織的細胞比例數;t為該組織細胞類型數目;所述的K為大于1的正整數,Q為大于1的正整數;
(2)對步驟(1)所得的模擬人工組織進行特征篩選,并對每個特征執行轉化到對數空間和歸一化操作,通過以上處理,得到數據集;
(3)對步驟(2)中得到的數據集,數據集若來源于s個不同數據集,將其分為訓練集和測試集進行s折交叉驗證,訓練集由s-1個來源不同的數據組成,測試集由剩下的1個來源的部分數據組成,確定batch size的大小,在訓練集中隨機抽取batch size個數據作為一次訓練的輸入數據;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于山東建筑大學,未經山東建筑大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210003514.7/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:自動作詩語言模型訓練方法、裝置、自動作詩方法及裝置
- 下一篇:雙軌道執行機構





