[發明專利]基于集成學習的全球人類mtDNA發育樹分類查詢方法有效
| 申請號: | 201711426265.8 | 申請日: | 2017-12-26 |
| 公開(公告)號: | CN108052796B | 公開(公告)日: | 2021-07-13 |
| 發明(設計)人: | 周維;彭旻晟;賈俊燕;王文智;向文坤;張亞平 | 申請(專利權)人: | 云南大學 |
| 主分類號: | G16B20/20 | 分類號: | G16B20/20;G16B20/30;G16B30/10;G16B40/00;G06F16/28;G06K9/62 |
| 代理公司: | 成都行之專利代理事務所(普通合伙) 51220 | 代理人: | 溫利平;陳靚靚 |
| 地址: | 650091*** | 國省代碼: | 云南;53 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 集成 學習 全球 人類 mtdna 發育 分類 查詢 方法 | ||
1.一種基于集成學習的全球人類mtDNA發育樹分類查詢方法,其特征在于,包括以下步驟:
S1:人工測得若干mtDNA數據,每條數據包含mtDNA的變異位點序列及對應的最有可能的分類,然后獲取全球人類mtDNA發育樹數據,包括分類信息及每個分類對應的mtDNA變異位點序列;
S2:采用mtDNA數據中的變異位點序列作為輸入,對應分類作為期望輸出,訓練得到神經網絡分類器;
S3:采用mtDNA發育樹數據計算得到樸素貝葉斯分類器的參數,包括第i個分類targeti出現的概率P(targeti)、第j個變異位點mutationj在第i個分類targeti中出現的概率P(mutationj|targeti),i=1,2,…,T,T表示分類數量,j=1,2,…,M,M表示變異位點數量;
S4:將待分類查詢的mtDNA的變異位點序列mutationsc輸入神經網絡分類器,得到前Q個可能分類,記該變異位點序列mutationsc屬于這Q個可能分類的概率為αq,查詢得到這Q個可能分類對應的變異位點序列其中q=1,2,…,Q;
將待分類查詢的變異位點序列mutationsc與神經網絡分類器前Q個可能分類所對應的變異位點序列合并得到變異位點序列mutations′c,計算變異位點序列修改中各個變異位點的權重ωd:
其中,d=1,2,…,D,D表示待分類查詢的變異位點序列mutationsc中變異位點數量,βd,c表示變異位點序列mutations′c中第d個變異位點是否屬于變異位點序列mutationsc,如果是βd,c=1,否則βd,c=0;βd,q表示變異位點序列mutations′c中第d個變異位點是否屬于Q個可能分類中第q個分類,如果是βd,q=1,否則βd,q=0;
將變異位點序列mutations′c及D個權重ωd輸入樸素貝葉斯分類器,根據以下公式計算每個分類targeti對應的分類評價值Ri:
將分類評價值Ri進行降序排列,取前Q個可能分類,記變異位點序列mutations′c屬于這Q個可能分類的概率為α′q;
按照預設權重對得到的兩組Q個可能分類的概率αq和α′q進行加權,按照概率從大到小輸出前Q個可能分類。
2.根據權利要求1所述的全球人類mtDNA發育樹分類查詢方法,其特征在于,所述步驟S2中,在對神經網絡分類器進行訓練之前,先對mtDNA數據進行預處理,其具體方法為:采用哈希算法對mtDNA數據中的每條數據的變異位點序列進行數值化,存入預設長度的數組中,得到變異位點向量,將分類轉化為獨熱向量得到分類向量。
3.根據權利要求2所述的全球人類mtDNA發育樹分類查詢方法,其特征在于,所述哈希算法為BKDRHash算法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于云南大學,未經云南大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711426265.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:齒輪齒條中心驅動的多層樓房用電梯
- 下一篇:一種組裝式欄桿





