[發明專利]基于峰聚類的單細胞染色質可及性測序數據分析方法和系統在審
| 申請號: | 201910256667.0 | 申請日: | 2019-03-29 |
| 公開(公告)號: | CN111755071A | 公開(公告)日: | 2020-10-09 |
| 發明(設計)人: | 瞿昆;方靖文;黎斌;李楊 | 申請(專利權)人: | 中國科學技術大學 |
| 主分類號: | G16B20/30 | 分類號: | G16B20/30 |
| 代理公司: | 中科專利商標代理有限責任公司 11021 | 代理人: | 崔亞松;張瑩 |
| 地址: | 230026 安*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 峰聚類 單細胞 染色質 序數 分析 方法 系統 | ||
1.一種基于峰聚類的單細胞染色質可及性測序數據分析方法,包括:
將單細胞染色質可及性測序數據與相應的生物樣本基因組數據進行比對獲得比對結果,并在所述比對結果的基礎上尋峰,并計算每個峰內讀數,得到細胞*峰的讀數矩陣;
計算細胞*峰的讀數矩陣中峰與峰之間的數學距離,將峰聚類,并將細胞*峰的讀數矩陣合并為細胞*accesson的讀數矩陣,其中accesson為聚類后的峰;
所述方法還包括利用所述細胞*accesson的讀數矩陣構建細胞發育路徑假時間情況。
2.根據權利要求1所述的分析方法,其中,所述方法還包括將所述細胞*accesson的讀數矩陣降維為二位可視化矩陣。
3.根據權利要求2所述的分析方法,其中,降維的方法包括PCA、T-SNE或UMAP。
4.根據權利要求1所述的分析方法,其中,所述方法還包括根據所述細胞*accesson的讀數矩陣對細胞進行聚類。
5.根據權利要求1所述的分析方法,其中,聚類算法包括KNN聚類、kernel聚類或louvain聚類。
6.根據權利要求1所述的分析方法,其中,構建細胞發育路徑假時間情況時所用算法包括SPRING或monocle。
7.根據權利要求1-6中任一項所述的分析方法,其中,所述數學距離包括歐氏距離、皮爾遜相關系數或cityblock距離;所述峰聚類的方法包括KNN、DBSAN或K-Mean。
8.根據權利要求1所述的分析方法,其中,將細胞*峰的讀數矩陣合并為細胞*accesson的讀數矩陣的方法包括取accesson中峰讀數的和、峰讀數的平均值、峰讀數的中位數或峰讀數的方差。
9.一種基于峰聚類的單細胞染色質可及性測序數據分析系統,包括預處理模塊和accesson構建模塊;
其中,預處理模塊包括a)比對單元,用于將單細胞染色質可及性測序數據與相應的生物樣本基因組數據進行比對獲得比對結果;b)尋峰單元,用于將所有單細胞的比對結果合并,然后尋峰;c)讀數計算單元,計算每個峰內的讀數,得到細胞*峰的讀數矩陣;
accesson構建模塊包括i)峰距離計算單元,用于計算細胞*峰的讀數矩陣中峰與峰之間的數學距離;ii)峰聚類單元,用于根據峰與峰之間的數學距離將峰聚類;iii)矩陣轉換單元,用于將細胞*峰的讀數矩陣合并為細胞*accesson的讀數矩陣,其中accesson為聚類后的峰;
所述系統還包括細胞發育路徑重塑模塊,用于利用所述細胞*accesson的讀數矩陣構建細胞發育路徑假時間情況。
10.根據權利要求9所述的分析系統,其中,所述系統還包括可視化模塊,用于將所述細胞*accesson的讀數矩陣降維為二位可視化矩陣。
11.根據權利要求10所述的分析系統,其中,降維的方法包括PCA、T-SNE或UMAP。
12.根據權利要求9所述的分析系統,其中,所述系統還包括細胞聚類模塊,用于根據所述細胞*accesson的讀數矩陣對細胞進行聚類。
13.根據權利要求12所述的分析系統,其中,聚類算法包括KNN聚類、kernel聚類或louvain聚類。
14.根據權利要求9所述的分析系統,其中,構建細胞發育路徑假時間情況時所用算法包括SPRING或monocle。
15.根據權利要求9或10所述的分析系統,其中,所述數學距離包括歐氏距離、皮爾遜相關系數或cityblock距離;所述峰聚類的方法包括KNN、DBSAN或K-Mean。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學技術大學,未經中國科學技術大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910256667.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種雙側開口緊線器
- 下一篇:高溫超導磁懸浮推進系統





