[發明專利]基于單細胞轉錄組測序數據的細胞聚類方法有效
| 申請號: | 202110983443.7 | 申請日: | 2021-08-25 |
| 公開(公告)號: | CN113674800B | 公開(公告)日: | 2022-02-08 |
| 發明(設計)人: | 王曉武;林潤茂;武劍;梁建麗;郭新磊 | 申請(專利權)人: | 中國農業科學院蔬菜花卉研究所 |
| 主分類號: | G16B20/30 | 分類號: | G16B20/30;G06K9/62 |
| 代理公司: | 北京北匯律師事務所 11711 | 代理人: | 高元吉 |
| 地址: | 100081 北京市海淀區中關村南大*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 單細胞 轉錄 序數 細胞 方法 | ||
1.一種基于單細胞轉錄組測序數據的細胞聚類方法,其特征在于,包括以下步驟:
(1)獲取由單細胞轉錄組測序得到的多個細胞的原始數據集,處理原始測序數據集排除對應于分類可疑的細胞的測序數據,將剩余測序數據挑選為分析數據集;
(2)對所述分析數據集進行降維分析,得到聚類結果;
其中,步驟(1)包括利用下式挑選細胞,將挑選得到的多個細胞所對應的單細胞轉錄組測序數據作為分析數據集:
T1={(x1,M11),(x2,M12),…,(xN,M1N)}
T2={(x1,M21),(x2,M22),…,(xN,M2N)}
Tg={(x1,Mg1),(x2,Mg2),…,(xN,MgN)}
其中,N為細胞總數,xi為第i個細胞,Tg為第g種分析方法得到N個細胞的分類信息,Mgi={c1,c2,…,ck}為k個細胞簇,由N個細胞的分類狀態{(M11,M21,…,Mg1),…,(M1N,M2N,…,MgN)}生成函數f(x),然后挑選滿足的細胞x,i∈{1,2,…,N},j∈{1,2,…,k},t為1-g的任意值,I為指示函數。
2.根據權利要求1所述的基于單細胞轉錄組測序數據的細胞聚類方法,其特征在于,步驟(2)采用由PCA+tSNE或PCA+UMAP組成的方法進行降維分析,得到聚類結果。
3.根據權利要求1所述的基于單細胞轉錄組測序數據的細胞聚類方法,其特征在于,進一步包括(3)細胞聚類結果評估步驟,其包括計算純度、ARI和NMI。
4.根據權利要求3所述的基于單細胞轉錄組測序數據的細胞聚類方法,其特征在于,通過下式計算純度:
其中,N指細胞的總數,U={U1,…,Ui}指參考的細胞類別,V={V1,…,Vj}指待查詢的細胞類別。
5.根據權利要求3所述的基于單細胞轉錄組測序數據的細胞聚類方法,其特征在于,通過下式計算ARI:
其中,n=∑ini.=∑jn.j,i和j分別為參考的和待查詢的細胞類別的數目。
6.根據權利要求3所述的基于單細胞轉錄組測序數據的細胞聚類方法,其特征在于,通過下式計算NMI:
其中,I(U,V)指互信息,H(U)和H(V)指熵。
7.根據權利要求3所述的基于單細胞轉錄組測序數據的細胞聚類方法,其特征在于,所述純度、ARI和NMI各自分別為0.5以上。
8.根據權利要求1所述的基于單細胞轉錄組測序數據的細胞聚類方法,其特征在于,進一步包括(4)對聚類結果進行注釋分析的步驟。
9.根據權利要求1所述的基于單細胞轉錄組測序數據的細胞聚類方法,其特征在于,所述細胞為動物細胞或植物細胞。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國農業科學院蔬菜花卉研究所,未經中國農業科學院蔬菜花卉研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110983443.7/1.html,轉載請聲明來源鉆瓜專利網。





