[發(fā)明專利]一種歸一化并比較水平基因轉(zhuǎn)移網(wǎng)絡(luò)的方法在審
| 申請?zhí)枺?/td> | 202211727781.5 | 申請日: | 2022-12-30 |
| 公開(公告)號: | CN115966250A | 公開(公告)日: | 2023-04-14 |
| 發(fā)明(設(shè)計)人: | 陳銀;趙梓丞;李靜 | 申請(專利權(quán))人: | 深圳百人科技有限公司 |
| 主分類號: | G16B5/20 | 分類號: | G16B5/20;G16B30/00;G16B40/00 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 518118 廣東省深圳市坪山區(qū)坑梓街*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 歸一化 比較 水平 基因 轉(zhuǎn)移 網(wǎng)絡(luò) 方法 | ||
本發(fā)明公開了一種歸一化并比較水平基因轉(zhuǎn)移網(wǎng)絡(luò)的方法,包括以下步驟:S1:采用貝葉斯概率模型將HGT根據(jù)測序量進(jìn)行歸一化;S2:在HGT網(wǎng)絡(luò)中,將每個基因組被表示為一個頂點,其中,如果HGT發(fā)生在兩個基因組之間,則在兩個頂點之間有一條邊;S3:采用不同的分類級別對基因組序列進(jìn)行注釋,得到了不同分類等級的HGT網(wǎng)絡(luò);S4:通過圖的密度、傳遞性、同配性和代數(shù)連通性幾種拓?fù)湫再|(zhì)對HGT網(wǎng)絡(luò)進(jìn)行分析。使用圖密度、傳遞性、同配性和代數(shù)連通性來描述網(wǎng)絡(luò),并在不同組別間的樣本中比較HGT網(wǎng)絡(luò),以對宏基因組和人體表型關(guān)聯(lián)提供新的分析方向,通過計算多種拓?fù)鋵傩詠矸治鯤GT網(wǎng)絡(luò),也能更加系統(tǒng)性地建模并分析宏基因組。
技術(shù)領(lǐng)域
本發(fā)明涉及基因轉(zhuǎn)移網(wǎng)絡(luò)技術(shù)領(lǐng)域,尤其涉及一種歸一化并比較水平基因轉(zhuǎn)移網(wǎng)絡(luò)的方法。
背景技術(shù)
人體微生物和人類有著復(fù)雜的相互作用。研究發(fā)現(xiàn),人體微生物和多種疾病都相關(guān)。人體微生物是個復(fù)雜的生態(tài)系統(tǒng),以腸道微生物組為例,F(xiàn)erretti等人利用菌株水平的宏基因組圖譜來跟蹤母嬰間的細(xì)菌傳播;他們發(fā)現(xiàn)母嬰對中共有的菌株;在最近關(guān)于腸道微生物組的研究中,不少研究者建立了宏基因組和人類表型之間的聯(lián)系,但這些工作未能從系統(tǒng)的角度對腸道微生物組進(jìn)行建模。近年,研究人員應(yīng)用HGT網(wǎng)絡(luò)分析宏基因組,提取微生物組的特征,并探尋微生物組和表型的關(guān)聯(lián)。
存在的缺點或不足:
雖然目前研究者建立了宏基因組和人類表型之間的聯(lián)系,但是這些工作無法從系統(tǒng)的角度對腸道微生物區(qū)系進(jìn)行建模。HGT網(wǎng)絡(luò)是一種系統(tǒng)性分析宏基因組的工具,然而由于HGT網(wǎng)絡(luò)會受到測序數(shù)據(jù)量的影響,可能會導(dǎo)致一些假陽性的宏基因組和表型的關(guān)聯(lián),因此需要歸一化并比較水平基因轉(zhuǎn)移網(wǎng)絡(luò)。本發(fā)明涉及一種歸一化HGT網(wǎng)絡(luò),并計算HGT網(wǎng)絡(luò)拓?fù)鋵傩缘姆椒ā?梢詷?biāo)準(zhǔn)化的比較試驗組和對照組的宏基因組,從而系統(tǒng)性地建模并分析宏基因組。
發(fā)明內(nèi)容
本發(fā)明的目的是為了解決現(xiàn)有技術(shù)中存在的缺陷,而提出的歸一化并比較水平基因轉(zhuǎn)移網(wǎng)絡(luò)的方法。
為了實現(xiàn)上述目的,本發(fā)明采用了如下技術(shù)方案:
一種歸一化并比較水平基因轉(zhuǎn)移網(wǎng)絡(luò)的方法,包括以下步驟:
S1:采用貝葉斯概率模型將HGT根據(jù)測序量進(jìn)行歸一化;
S2:在HGT網(wǎng)絡(luò)中,將每個基因組被表示為一個頂點,其中,如果HGT發(fā)生在兩個基因組之間,則在兩個頂點之間有一條邊;
S3:采用不同的分類級別對基因組序列進(jìn)行注釋,得到了不同分類等級的HGT網(wǎng)絡(luò);
S4:通過圖的密度、傳遞性、同配性和代數(shù)連通性幾種拓?fù)湫再|(zhì)對HGT網(wǎng)絡(luò)進(jìn)行分析。
進(jìn)一步地,在步驟S1中:使用LocalHGT來檢測每個樣本中的HGT,并且得到支持每個HGT斷點對的reads數(shù)量,其中,當(dāng)所有樣本中的平均reads數(shù)目為Q時,根據(jù)模型推斷;
當(dāng)總reads數(shù)目為Q時,則支持每個HGT斷點對的reads數(shù)目的概率分布,根據(jù)這個概率分布,過濾HGT斷點;
過濾標(biāo)準(zhǔn)為:在總reads數(shù)目為Q的情況下,預(yù)期的reads數(shù)目大于x(默認(rèn)為2)的概率高于90%。
進(jìn)一步地,在步驟S4中:圖密度表示圖中存在的邊的數(shù)目除以圖可能具有的最大邊數(shù);
傳遞性為通過觀察到的三角形數(shù)與圖中可能的最大三角形數(shù)之比計算獲得,傳遞性度量頂點的相鄰頂點相互連接的總體概率;
同配性為圖中的節(jié)點與具有相似度的節(jié)點相連接的趨勢,通過關(guān)聯(lián)度與關(guān)聯(lián)度的皮爾遜相關(guān)系數(shù)來量化關(guān)聯(lián)度;
代數(shù)連通度是圖的拉普拉斯矩陣的第二小特征值;
拓?fù)鋵傩允鞘褂肞ython模塊NetworkX計算。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳百人科技有限公司,未經(jīng)深圳百人科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211727781.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





