[發(fā)明專利]基于鏈?zhǔn)剿阉魉惴ǖ哪赶礛T單倍群鑒定方法、裝置及設(shè)備在審
| 申請?zhí)枺?/td> | 202110024674.5 | 申請日: | 2021-01-08 |
| 公開(公告)號: | CN112687335A | 公開(公告)日: | 2021-04-20 |
| 發(fā)明(設(shè)計)人: | 馬玉昆;黎松;賈寒;李峰峰;溫顏華;李根;呂麗 | 申請(專利權(quán))人: | 北京果殼生物科技有限公司 |
| 主分類號: | G16B20/30 | 分類號: | G16B20/30;G16B20/20;G16B50/00 |
| 代理公司: | 北京細軟智谷知識產(chǎn)權(quán)代理有限責(zé)任公司 11471 | 代理人: | 付登云 |
| 地址: | 102200 北京市昌平區(qū)*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 鏈?zhǔn)?/a> 搜索 算法 母系 mt 單倍群 鑒定 方法 裝置 設(shè)備 | ||
1.一種基于鏈?zhǔn)剿阉魉惴ǖ哪赶礛T單倍群鑒定方法,其特征在于,包括:
將目標(biāo)數(shù)據(jù)庫的母系單倍群數(shù)據(jù)解析為預(yù)設(shè)格式的基準(zhǔn)母系單倍群數(shù)據(jù);
獲取樣本芯片檢測結(jié)果,將所述樣本檢測結(jié)果進行forward鏈轉(zhuǎn)換,獲取每個樣本檢測結(jié)果的基因型信息;
根據(jù)所述樣本檢測結(jié)果的基因型信息,提取每個所述樣本檢測結(jié)果的突變位點信息,并根據(jù)所述突變位點信息及命名規(guī)則,對所述突變位點信息進行命名并進行格式轉(zhuǎn)換,獲取目標(biāo)格式的基因型信息;
根據(jù)所述目標(biāo)格式的基因型信息,與所述基準(zhǔn)母系單倍群數(shù)據(jù)進行比對,根據(jù)匹配到的基因突變信息計算每個樣本所有MT單倍群的初始得分;
對初始得分超過預(yù)設(shè)得分閾值的單倍群,進行全局鏈?zhǔn)剿阉鳎@取每個樣本的的可信單倍群鏈和單倍群的最終全局得分;
按照最終全局得分對所有候選單倍群進行排序,得分最高且可信單倍群鏈最長的單倍群為鑒定結(jié)果。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述目標(biāo)數(shù)據(jù)庫為PhyloTree;所述將目標(biāo)數(shù)據(jù)庫的母系單倍群數(shù)據(jù)解析為預(yù)設(shè)格式的基準(zhǔn)母系單倍群數(shù)據(jù),包括:
將html格式的母系單倍群數(shù)據(jù)解析成以tab鍵分割的txt格式文件,命名為database.txt;所述解析后的txt文件,包含兩列信息,分別為單倍群名稱和所述單倍群對應(yīng)的突變位點信息,突變位點命名方式為祖先堿基-位置-衍生堿基。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述樣本檢測結(jié)果的基因型信息,提取每個所述樣本檢測結(jié)果的突變位點信息,并根據(jù)所述突變位點信息及命名規(guī)則,對所述突變位點信息進行命名并進行格式轉(zhuǎn)換,獲取目標(biāo)格式的基因型信息,包括:
提取每個所述樣本檢測結(jié)果中所有MT線粒體上位點的基因型結(jié)果,比較檢測基因型與參考基因型,保留與參考等位不一致的位點,按照預(yù)設(shè)命名規(guī)則進行突變位點的命名并將過濾后的突變位點基因型結(jié)果轉(zhuǎn)換成hsd格式文件;
所述hsd格式文件包含四列信息,第一列為樣本名稱,第二列為檢測范圍,第三列為單倍群信息,第四列為保留的檢測位點基因型并按突變位點所在的MT位置從小到大進行排序。
4.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述根據(jù)所述目標(biāo)格式的基因型信息,與所述基準(zhǔn)母系單倍群數(shù)據(jù)進行比對,根據(jù)匹配到的基因突變信息計算每個樣本信息的MT單倍群的初始得分,包括:
根據(jù)所述樣本的突變點位信息,匹配所述database.txt中的單倍群;
根據(jù)匹配的結(jié)果獲取匹配到的每個單倍群的初始得分。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述對初始得分超過預(yù)設(shè)得分閾值的單倍群,進行全局鏈?zhǔn)剿阉鳎ǎ?/p>
獲取初始得分大于等于0.5的單倍群;將所述初始得分大于等于0.5的單倍群,按照預(yù)設(shè)全局鏈?zhǔn)剿阉饕?guī)則進行全局鏈?zhǔn)剿阉鳌?/p>
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述預(yù)設(shè)全局鏈?zhǔn)剿阉饕?guī)則,包括:
若候選單倍群與被搜索單倍群名字完全一樣,則跳過并搜索下一個單倍群;
若候選單倍群名字完全包含被搜索單倍群,則候選單倍群初始得分累加上被搜索單倍群初始得分,且,候選單倍群匹配的單倍群添加上被搜索單倍群,形成單倍群鏈;
候選單倍群H1搜索全部其它單倍群后,給出最終的單倍群鏈和最終得分;
全局鏈?zhǔn)剿阉魍瓿珊螅M行單倍群與單倍群鏈核對和檢查,如果與單倍群鏈中最鄰近單倍群之間步長相差大于2且突變位點頻數(shù)大于2則該單倍群不予考慮,認為是因為位點多單倍群匹配導(dǎo)致的結(jié)果。
7.根據(jù)權(quán)利要求1-6任一所述的方法,其特征在于,所述獲取樣本檢測結(jié)果,包括:基于設(shè)計有線粒體位點探針的人全基因組SNP芯片,獲取樣本檢測結(jié)果。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京果殼生物科技有限公司,未經(jīng)北京果殼生物科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110024674.5/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





