[發(fā)明專利]基于化學(xué)基因組學(xué)的小分子靶標(biāo)預(yù)測(cè)算法及其應(yīng)用有效
| 申請(qǐng)?zhí)枺?/td> | 202010165489.3 | 申請(qǐng)日: | 2020-03-11 |
| 公開(公告)號(hào): | CN111383708B | 公開(公告)日: | 2023-05-12 |
| 發(fā)明(設(shè)計(jì))人: | 曹東升;楊素青 | 申請(qǐng)(專利權(quán))人: | 中南大學(xué) |
| 主分類號(hào): | G16B15/30 | 分類號(hào): | G16B15/30;G16B40/20 |
| 代理公司: | 長(zhǎng)沙軒榮專利代理有限公司 43235 | 代理人: | 黃藝平 |
| 地址: | 410000 湖南*** | 國(guó)省代碼: | 湖南;43 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 化學(xué) 基因組 分子 靶標(biāo) 預(yù)測(cè) 算法 及其 應(yīng)用 | ||
本發(fā)明公開了一種基于化學(xué)基因組學(xué)的小分子靶標(biāo)預(yù)測(cè)算法,該算法建立的模型可用于小分子的靶標(biāo)預(yù)測(cè),其中預(yù)測(cè)模型的構(gòu)建方法包括建模數(shù)據(jù)收集、數(shù)據(jù)正負(fù)集的批分、配體蛋白特征的組合、模型構(gòu)建等。本發(fā)明的小分子靶標(biāo)預(yù)測(cè)算法是指給定一個(gè)預(yù)測(cè)分子,通過模型得出靶標(biāo)的預(yù)測(cè)排名列表,列表中排名越靠前的靶標(biāo)成為真實(shí)靶標(biāo)的可能性越大。該小分子靶標(biāo)預(yù)測(cè)算法通過將涉及不同方面信息的多個(gè)模型合并建立一個(gè)共識(shí)模型,能夠獲得穩(wěn)定矯健的靶標(biāo)預(yù)測(cè)性能。將其應(yīng)用預(yù)測(cè)小分子靶標(biāo),預(yù)測(cè)準(zhǔn)確率高。
技術(shù)領(lǐng)域
本發(fā)明涉及農(nóng)業(yè)生物技術(shù)領(lǐng)域,尤其涉及一種基于化學(xué)基因組學(xué)的小分子靶標(biāo)預(yù)測(cè)算法及其應(yīng)用。
背景技術(shù)
藥物與蛋白等大分子產(chǎn)生相互作用是藥物分子發(fā)揮作用的重要前提。在藥物發(fā)現(xiàn)與發(fā)展階段,靶標(biāo)的確定是現(xiàn)代新藥開發(fā)的基礎(chǔ)。藥物靶標(biāo)的確定對(duì)藥物的臨床應(yīng)用進(jìn)行更透徹的闡明。這對(duì)中藥天然產(chǎn)物尤其重要,將有利于中藥的全球化發(fā)展。例如中藥蟾蜍具有抗腫瘤作用,后證實(shí)原因是其主要成分蟾蜍靈抑制Na+/K+-ATP酶。藥物脫靶靶標(biāo)的確定有利于藥物的結(jié)構(gòu)修飾,優(yōu)化其選擇性,為藥物發(fā)展提供更大的發(fā)展空間。藥物新作用靶標(biāo)的發(fā)現(xiàn)有利于藥物的重定向。由于新藥上市的困難性,藥物重定向現(xiàn)已成為現(xiàn)代藥物上市最經(jīng)濟(jì)有效的手段。例如原開發(fā)用于治療心絞痛的西地那非,由于抑制PDE5靶點(diǎn)而具有治愈男性功能障礙的藥理療效,后被開發(fā)為廣泛應(yīng)用的萬艾可。
靶標(biāo)確證的實(shí)驗(yàn)方法由于時(shí)間及經(jīng)濟(jì)成本高,涉及大量的蛋白靶標(biāo)檢測(cè)變得困難。與之相比,作為輔助手段的計(jì)算機(jī)靶標(biāo)預(yù)測(cè)方法在近年來備受青睞。它通過從巨大的蛋白空間中找出與預(yù)測(cè)化合物作用概率大的少數(shù)蛋白質(zhì),在保證較高回收率的前提下實(shí)現(xiàn)蛋白富集,減少實(shí)驗(yàn)的負(fù)荷量。計(jì)算方法主要包括基于蛋白結(jié)構(gòu)與基于配體結(jié)構(gòu)兩類方法。基于蛋白結(jié)構(gòu)的方法利用化合物與蛋白的相互作用尋找靶標(biāo),但蛋白三維結(jié)構(gòu)的必須性使得該方法的適用范圍小。基于配體結(jié)構(gòu)的方法通過配體間的相似性映射靶標(biāo),但這類方法沒有考慮蛋白質(zhì)信息對(duì)預(yù)測(cè)的影響。同時(shí),如果靶標(biāo)的活性分子數(shù)量或結(jié)構(gòu)多樣性不足,預(yù)測(cè)結(jié)果不可靠。因此,需要發(fā)展一種新方法彌補(bǔ)基于配體方法的這些缺陷。
近年來,更復(fù)雜的化學(xué)基因組學(xué)發(fā)展起來。它通過將化合物與蛋白的特征組合起來進(jìn)行物-靶標(biāo)相互作用的預(yù)測(cè)。該方法同時(shí)探索小分子與蛋白空間,相似靶點(diǎn)的配體數(shù)據(jù)被整個(gè)模型共用,蛋白特征的加入也表明蛋白在靶標(biāo)預(yù)測(cè)具有表決權(quán)。這些特點(diǎn)彌補(bǔ)了上述方法的不足。但現(xiàn)有的化學(xué)基因組學(xué)僅局限于藥物-靶標(biāo)作用關(guān)系對(duì)預(yù)測(cè),不能提供靶標(biāo)的預(yù)測(cè)排名列表,極大地限制了該方法在藥物靶標(biāo)預(yù)測(cè)領(lǐng)域的發(fā)展。因此,本發(fā)明旨在挖掘化學(xué)基因組學(xué)在靶標(biāo)預(yù)測(cè)方面的價(jià)值,并將該方法的靶標(biāo)預(yù)測(cè)性能提供給廣大研究者。
發(fā)明內(nèi)容
本發(fā)明要解決的技術(shù)問題是克服現(xiàn)有技術(shù)的不足,提供一種基于化學(xué)基因組學(xué)的小分子靶標(biāo)預(yù)測(cè)算法及其應(yīng)用。其中,利用該算法可建立模型用于小分子的靶標(biāo)預(yù)測(cè),靶標(biāo)預(yù)測(cè)模型是指給定一個(gè)預(yù)測(cè)分子,通過模型得出靶標(biāo)的預(yù)測(cè)排名列表,列表中排名越靠前的靶標(biāo)成為真實(shí)靶標(biāo)的可能性越大。本發(fā)明克服現(xiàn)有計(jì)算機(jī)輔助藥物靶標(biāo)預(yù)測(cè)方法的不足,實(shí)現(xiàn)小分子對(duì)人類蛋白靶標(biāo)的預(yù)測(cè)過程,使用高質(zhì)量的人源蛋白靶標(biāo)數(shù)據(jù)集,建立了一種創(chuàng)新的蛋白靶標(biāo)預(yù)測(cè)方法。
為了實(shí)現(xiàn)上述目的,本發(fā)明提供了一種基于化學(xué)基因組學(xué)的小分子靶標(biāo)預(yù)測(cè)算法,所述的小分子靶標(biāo)預(yù)測(cè)算法采用以下方法構(gòu)建:
S1、建模數(shù)據(jù)收集:收集人源蛋白數(shù)據(jù),將與收集的所述人源蛋白相互作用的配體形成的配體-蛋白相互作用對(duì)作為建模樣本;
S2、數(shù)據(jù)正負(fù)集的批分:,將所述建模樣本中活性值低于0.1μm的配體-蛋白相互作用對(duì)作為建模的正樣本,活性值高于0.1μm的配體-蛋白相互作用對(duì)作為負(fù)樣本;
S3、配體蛋白特征的組合:選擇ECFP4指紋,MACCS指紋,以及Mol2d描述符作為配體的表征;選擇Proa特征和Prob特征作為蛋白的表征;將三大配體的表征和兩大蛋白的表征兩兩組合,分別構(gòu)建6個(gè)表征;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中南大學(xué),未經(jīng)中南大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010165489.3/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 化學(xué)處理方法和化學(xué)處理裝置
- 基礎(chǔ)化學(xué)數(shù)字化學(xué)習(xí)中心
- 化學(xué)處理方法和化學(xué)處理裝置
- 化學(xué)清洗方法以及化學(xué)清洗裝置
- 化學(xué)強(qiáng)化組合物、化學(xué)強(qiáng)化方法及化學(xué)強(qiáng)化玻璃
- 化學(xué)天平(無機(jī)化學(xué))
- 電化學(xué)裝置的化學(xué)配方
- 化學(xué)強(qiáng)化方法、化學(xué)強(qiáng)化裝置和化學(xué)強(qiáng)化玻璃
- 化學(xué)強(qiáng)化方法及化學(xué)強(qiáng)化玻璃
- 化學(xué)打尖方法和化學(xué)組合物
- 減毒的人-牛嵌合呼吸道合胞病毒疫苗的生產(chǎn)
- 減毒的人-牛嵌合呼吸道合胞病毒疫苗的生產(chǎn)
- 用于對(duì)基因組進(jìn)行壓縮和解壓縮的方法和裝置
- 一種基因組重測(cè)序分析系統(tǒng)及方法
- 病原微生物基因組數(shù)據(jù)庫(kù)及其建立方法
- 宏基因組的重組裝方法、重組裝裝置及終端設(shè)備
- 用于保存和使用基因組及基因組數(shù)據(jù)的方法
- 識(shí)別胚胎中染色體異常的系統(tǒng)和方法
- 菌株基因組注釋查詢方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 真菌基因組測(cè)序數(shù)據(jù)自動(dòng)分析方法及系統(tǒng)





