[發明專利]基于芯片檢測DNA數據的性別判斷方法有效
| 申請號: | 201910266630.6 | 申請日: | 2019-04-03 |
| 公開(公告)號: | CN110033828B | 公開(公告)日: | 2021-06-18 |
| 發明(設計)人: | 范操琦 | 申請(專利權)人: | 北京各色科技有限公司 |
| 主分類號: | G16B30/00 | 分類號: | G16B30/00 |
| 代理公司: | 北京紐樂康知識產權代理事務所(普通合伙) 11210 | 代理人: | 張朝元 |
| 地址: | 100015 北京市朝陽區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 芯片 檢測 dna 數據 性別 判斷 方法 | ||
本發明公開了一種基于芯片檢測DNA數據的性別判斷方法,包括以下步驟:選出所有性別相關X和Y染色體上的位點S個,讀取P個樣本,得到P×S大小矩陣,篩選區分度大的M個位點;對M個位點中的每一個位點,建立邏輯回歸模型,自變量為DNA檢測紅熒光和DNA檢測綠熒光數值,因變量取值0或1,代表男性和女性,得到M個回歸模型并保存;預測一個新樣本時,通過M個位點的邏輯回歸模型,得到M個取值在0到1之間的預測值,按照邏輯回歸預測值的概率解釋,計算最終的概率。該性別判斷方法結合X和Y兩類染色體的情況,通過機器學習的方法,充分量化,性別判斷結果為0?1區間的數值,能夠兼容多種數據情況,針對性別做出更豐富的判斷。
技術領域
本發明涉及DNA檢測技術領域,具體來說,涉及一種基于芯片檢測DNA數據的性別判斷方法。
背景技術
基于芯片檢測DNA數據的性別判斷,一般根據DNA數據的X和Y染色體的分型情況。常見的方法有兩種:1)只通過X染色體的分型數據,大多數情況下,女性有2條X染色體,分型數據有純合子、雜合子2種類型,男性有1條X染色體,分型數據只有純合子1種類型,一般可以通過統計某樣本X染色體分型數據的純合率或者雜合率,確認性別;2)只通過Y染色體的分型數據,大多數情況下,女性沒有Y染色體,不該出現Y染色體數據,男性有1條Y染色體,分型數據有純合子1種類型,一般可以通過統計某樣本是否有Y染色體數據,確認性別。
以上2種方法能夠判斷大多數情況,但是很多異常情況無法識別。比如某些人存在X染色體或Y染色體的異常,會影響判斷準確性,此外,以上2種方法是基于傳統的統計學,根據經驗進行一般判斷,無法做出更精準的預測。
發明內容
針對相關技術中的上述技術問題,本發明提出一種基于芯片檢測DNA數據的性別判斷方法,能夠克服現有技術的上述不足。
為實現上述技術目的,本發明的技術方案是這樣實現的:
一種基于芯片檢測DNA數據的性別判斷方法,包括以下步驟:
(1)選出所有性別相關X和Y染色體上的位點S個,讀取P個樣本,得到P×S大小矩陣;
(2)將紅綠熒光強度標準化,其中GrnM為每個樣本綠熒光的數值,RedM為每個樣本紅熒光的數值,GrnM*為每個樣本綠熒光的標準化數值,RedM*為每個樣本紅熒光的標準化數值:
GrnM* = GrnM / mean(GrnM)(每個樣本某個位點上綠熒光數值除以所有樣本該位點綠熒光數值的均值);
RedM* = RedM / mean(RedM)(每個樣本某個位點上紅熒光數值除以所有樣本該位點紅熒光數值的均值);
引入兩個新的矩陣:
AbsM = (GrnM^2 + RedM^2)^(0.5)(每個樣本某個位點上綠熒光數值的平方加上該樣本該位點紅熒光數值的平方,然后開方);
SumM = GrnM + RedM(每個樣本某個位點上綠熒光數值加上該樣本該位點紅熒光數值);
(3)篩選區分度大的M個位點:我們認為,男女信號的可劃分性,基本蘊含在上面四個參數中,因此對步驟(2)中的四個矩陣的每一行做t檢驗,因變量為0(男)或1(女),這樣對每一個位點都得到4個p值,將每一種參數下p值前X小的位點做并集,得到M個位點;
(4)根據步驟(3)篩選出的M個位點,建立邏輯回歸模型:對M個位點中的每一個位點,建立邏輯回歸模型,自變量為紅熒光和綠熒光數值,因變量取值0(男)或1(女),這樣總共得到M個回歸模型,將其保存;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京各色科技有限公司,未經北京各色科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910266630.6/2.html,轉載請聲明來源鉆瓜專利網。





