[發明專利]一種宏基因組重疊群的無監督分類方法有效
| 申請號: | 201611201966.7 | 申請日: | 2016-12-23 |
| 公開(公告)號: | CN106599618B | 公開(公告)日: | 2021-07-23 |
| 發明(設計)人: | 劉云;劉富;侯濤;康冰;王柯;姜守坤;王婧媛 | 申請(專利權)人: | 吉林大學 |
| 主分類號: | G16B40/20 | 分類號: | G16B40/20 |
| 代理公司: | 吉林長春新紀元專利代理有限責任公司 22100 | 代理人: | 白冬冬 |
| 地址: | 130012 吉*** | 國省代碼: | 吉林;22 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 宏基 重疊 監督 分類 方法 | ||
1.一種宏基因組重疊群的無監督分類方法,其步驟是:
一、重疊群數據的獲取:人體腸道的宏基因組數據;
二、特征向量的建立:計算每個重疊群的4-mer頻率特征,并利用公式進行歸一化,其中,N是宏基因組數據中重疊群的數量,fij是第j個DNA重疊群的4-mer頻率特征;
三、利用改進的模糊c-harmonic均值算法進行宏基因組重疊群分類,其流程為:
1)利用MATLAB的rand命令構建一個41786×200維的隨機矩陣作為隸屬度矩陣urs,該矩陣中的所有元素均為0到1區間的隨機數;
2)計算各個類的大小fj:
滿足
其特征在于:
3)通過考慮各個類的體量構建了代價函數,定義為:
其中fj為第j個類的體量,定義為所有樣本屬于該類的隸屬度值之和:
4)計算隸屬度矩陣,其求解過程為:
①根據約束條件構造拉格朗日函數:
②求J對于urs的偏導數:
③令可得:
④根據約束條件可得:
⑤可求得:
⑥將λr的計算公式帶入到公式(5)中,可得:
5)計算聚類中心,其推導過程為:
①求JNEW對于θj的偏導數:
②采用歐式距離,因此dij=||xi-θj||,可得:
因此,
③令可解得:
6)根據公式(12)計算各個類的聚類中心θj;
7)根據公式(8)計算隸屬度矩陣urs;
8)根據公式(2)計算各個類的大小fj
9)重復步驟6)到8),直到||U(t)-U(t-1)||<ε,其中ε=1×10-3;
10)去模糊化。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于吉林大學,未經吉林大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611201966.7/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種運行于分布式系統的海量測序數據錯誤修正方法
- 下一篇:一種驗證方法及裝置





