[發明專利]單細胞分類和篩選方法及其裝置有效
| 申請號: | 201110245356.8 | 申請日: | 2011-08-25 |
| 公開(公告)號: | CN102952854A | 公開(公告)日: | 2013-03-06 |
| 發明(設計)人: | 徐訊;鮑莉;何偉明;侯勇;陶曄 | 申請(專利權)人: | 深圳華大基因科技有限公司;深圳華大基因研究院 |
| 主分類號: | C12Q1/68 | 分類號: | C12Q1/68;C12Q1/04;C12N5/00;C12M1/00 |
| 代理公司: | 中國國際貿易促進委員會專利商標事務所 11038 | 代理人: | 曾暉 |
| 地址: | 518083 廣東省深圳市鹽田*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 單細胞 分類 篩選 方法 及其 裝置 | ||
1.單細胞分類方法,包括以下步驟:
將每個單細胞樣本經測序得到的reads結果與參考基因組序列進行比對,并將比對結果進行數據過濾;
根據過濾后的數據確定每個單細胞樣本的一致基因型,并將所有單細胞樣本的一致基因型保存為SNP數據集;
從已保存的SNP數據集提取與參考基因組SNP數據集位置對應的位點的基因型文件;
挑選細胞突變SNP位點,并根據細胞突變SNP位點的基因型文件,對細胞進行分類。
2.根據權利要求1所述單細胞分類方法,將比對結果進行數據過濾的操作,包括以下步驟:
當存在多對重復雙末端reads時,在多對reads的序列完全一致時隨機選擇一對reads,將所述多對reads中其他重復雙末端reads去除;和/或去除未唯一比對上參考基因組序列的reads。
3.根據權利要求1或2所述單細胞分類方法,根據過濾后的數據確定每個單細胞樣本的一致基因型的操作,包括以下步驟:
根據過濾后的數據計算每個單細胞樣本目標區域基因型的可能性文件;
根據基因型的可能性文件產生包含所有單細胞樣本每個位點的偽基因組,從偽基因組中選擇概率最大的基因型作為每個單細胞樣本的一致基因型。
4.根據權利要求1或2或3所述單細胞分類方法,挑選細胞突變SNP位點的操作,包括以下步驟:
去除非群體間的SNP位點、去除存在雜合丟失的位點和/或去除已經公布的SNP位點,得到細胞突變SNP位點。
5.根據權利要求4所述單細胞分類方法,去除存在雜合丟失的位點的操作中,去除滿足以下條件的位點:
當單細胞樣本數為N時,N為自然數,正常組織直接提取DNA測序的最后一列為雜合位點;
其它N-1個單細胞樣本中,雜合位點和數據丟失的樣本數大于等于N-3。
6.根據權利要求1至5中任一所述單細胞分類方法,從已保存的SNP數據集提取與參考基因組SNP數據集位置對應的位點的基因型文件的操作,包括以下步驟:
每個位點的一致性基因型的質量值不小于20,秩檢驗p值不小于1%;對于雜合變異的SNPs:最好堿基型測序質量值不小于20、測序深度不小于6,次好堿基型測序質量值不小于20,測序深度不小于2,且兩基因型測序深度的比值在0.2-5范圍內;
根據參考基因組SNP數據集位置信息確定位點,提取每個細胞每個位點的基因分型數據生成基因型文件。
7.根據權利要求1至6中任一所述單細胞分類方法,對細胞進行分類之后,還包括以下步驟:
提取每個細胞樣本信息,剔除存在異議的細胞。
8.根據權利要求1或7所述單細胞分類方法,對細胞進行分類之后,還包括以下步驟:
得到已預測基因組中基因的起止位置;
根據分類結果獲得已分類群體,計算每類群體中每個基因所有SNP位點的統計量,并累加統計量;
對獲得的統計量作差異檢驗,獲得檢驗值;
將已預測基因按統計量或檢驗值進行排序,篩選出統計量或檢驗值最高的基因。
9.單細胞分類裝置,包括:
數據過濾模塊,將每個單細胞樣本經測序得到的reads結果與參考基因組序列進行比對,并將比對結果進行數據過濾;
基因型確定模塊,根據過濾后的數據確定每個單細胞樣本的一致基因型,并將所有單細胞樣本的一致基因型保存為SNP數據集;
基因型文件提取模塊,從已保存的SNP數據集提取與參考基因組SNP數據集位置對應的位點的基因型文件;
分類模塊,挑選細胞突變SNP位點,根據細胞群體突變SNP的基因型文件,對細胞進行分類。
10.根據權利要求9所述單細胞分類裝置,其中:
數據過濾模塊在有多對重復雙末端reads時,從序列完全一致的多對reads中隨機選擇一對reads,將所述多對reads中其他重復雙末端reads去除;和/或去除未唯一比對上參考基因組序列的reads。
11.根據權利要求9或10所述單細胞分類裝置,其中:
基因型確定模塊根據過濾后的數據計算每個單細胞樣本目標區域基因型的可能性文件;根據基因型的可能性文件產生包含所有單細胞樣本每個位點的偽基因組,從偽基因組中選擇概率最大的基因型作為每個單細胞樣本的一致基因型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳華大基因科技有限公司;深圳華大基因研究院,未經深圳華大基因科技有限公司;深圳華大基因研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110245356.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:全自動液壓碼坯機
- 下一篇:一種加溫固化類噴漆零件的絕緣保護方法





