[發明專利]一種基于牽連犯罪原則和網絡拓撲結構特征的藥物?靶標相互作用識別方法有效
| 申請號: | 201510494047.2 | 申請日: | 2015-08-12 |
| 公開(公告)號: | CN105117618B | 公開(公告)日: | 2018-01-26 |
| 發明(設計)人: | 李占潮;鄒小勇;戴宗 | 申請(專利權)人: | 廣東順德中山大學卡內基梅隆大學國際聯合研究院;廣東藥學院;中山大學 |
| 主分類號: | G06F19/16 | 分類號: | G06F19/16 |
| 代理公司: | 廣州粵高專利商標代理有限公司44102 | 代理人: | 林麗明 |
| 地址: | 528399 廣東省佛山市*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 牽連 犯罪 原則 網絡 拓撲 結構 特征 藥物 靶標 相互作用 識別 方法 | ||
技術領域
本發明屬于計算機輔助藥物設計技術領域。更具體地,涉及一種基于牽連犯罪原則和網絡拓撲結構特征的藥物-靶標相互作用識別方法。
背景技術
新藥研究與開發一直是一個費時、費力的過程。據估計一個新藥上市平均要花費數十億美元和十多年時間。近年來新藥研發的成功率一直呈下降趨勢,造成這種現象的一個主要原因是藥物-靶標相互作用信息地缺乏。大部分藥物都是生物活性小分子,主要通過與靶標蛋白質的相互作用阻斷異常的生物過程發揮療效。因此,識別藥物-靶標相互作用一直是藥物研發的重要部分,識別藥物-靶標相互作用不僅可以減少研發成本和時間,而且有助于闡明藥物活性機制。
在藥物-靶標相互作用識別模型的構建中,蛋白質與藥物靶標相互作用對的合理、有效表征是影響模型預測性能的關鍵。采用蛋白質一級結構描述符和藥物分子指紋描述符表征藥物-靶標相互作用對是一種簡單的方法,通過該方法,藥物-靶標相互作用對可以表征為一個高維特征向量,但是該方法沒有考慮生物網絡的整體性和魯棒性等特點。因此,近年來研究人員提出了基于網絡的藥物-靶標相互作用識別方法,但是該方法僅把藥物-靶標相互作用模擬為二部圖,沒有考慮到蛋白質與蛋白質以及藥物與藥物之間的相互作用,而且僅把蛋白質和藥物考慮為一個單純的點,忽略了物理化學等性質。因此,提出全新的藥物-靶標相互作用表征方法,并發展自動、可靠的藥物-靶標相互作用識別方法具有重大的理論和實際應用意義。
發明內容
本發明要解決的技術問題是克服現有新藥研發中藥物-靶標相互作用識別技術的缺陷和不足,提供一種新的簡單、合理、高效的藥物-靶標相互作用標準方法——網絡拓撲結構特征,在網絡拓撲結構特征的基礎上,利用隨機森林算法構建模型對藥物-靶標相互作用進行識別研究,有望應用于新藥研究和計算機輔助藥物設計等領域。該表征方法不僅包含藥物指紋描述符和蛋白質一級結構描述符信息,而且還包含了網絡拓撲結構信息,預測結果明顯優于現有文獻報道結果。
本發明的目的是提供一種基于牽連犯罪原則和網絡拓撲結構特征的藥物-靶標相互作用識別方法。
本發明另一目的是提供該方法的應用。
本發明上述目的通過以下技術方案實現:
一種基于牽連犯罪原則和網絡拓撲結構特征的藥物-靶標相互作用識別方法,包括以下步驟:
S1.構建藥物-靶標相互作用組網絡
S11.從現有數據庫收集人類蛋白質與蛋白質相互作用數據和藥物-靶標相互作用數據;
S12.基于相互作用數據,構建包含蛋白質-蛋白質相互作用子網絡、藥物-靶標相互作用子網絡和藥物-藥物關系子網絡的綜合藥物-靶標相互作用組網絡;
S2.表征藥物-靶標相互作用對
S21.基于蛋白質一級序列信息和藥物小分子結構信息,分別計算其一級結構描述符和藥物分子指紋描述符,結合相互作用信息,對網絡節點和邊加權;
S22.基于加權的節點和邊信息,采用牽連犯罪原則和圖論分別計算網絡中蛋白質和藥物小分子的網絡拓撲結構特征,網絡拓撲結構特征通過下式計算:
式中,Dd(i)和Dj(i)分別表示藥物分子d和鄰居藥物分子j的第i個節點權重;
Ed,j是藥物分子d和j的邊權重;
Pp(i)和Pj(i)分別是蛋白質p和其鄰居蛋白質j的第i個節點權重;
Ep,j是蛋白質p和鄰居j的邊權重;
N是藥物分子d或者蛋白質p的鄰居總數;
S23.基于蛋白質和藥物小分子的網絡拓撲結構特征,提出藥物d-靶標p的相互作用對網絡拓撲結構特征,其表示如下:
式中,表示正交求和;最終,藥物-靶標相互作用對被表征為一個2791維的特征向量;
S3.采用隨機森林算法構建預測模型,預測潛在藥物-靶標相互作用,為新藥設計和病理機制研究提供理論參考。
具體地,步驟S11所述現有數據庫為DrugBank數據庫和HIPPIE數據庫。
步驟S12所述子網絡中,每一個定點表示蛋白質或者藥物小分子;如果兩個蛋白質或者藥物-靶標具有相互作用,則用一條邊連接這兩個頂點;如果兩個藥物小分子具有共同的蛋白質靶標,則用一條邊連接。
步驟S21所述一級結構描述符是一個1767維特征向量,包括:氨基酸組成、二肽組成、各種自相關描述符以及組成、轉變和分布描述符;所述分子指紋描述符是一個1024維的二進制特征向量,“1”表示藥物分子具有某一種特定分子結構,“0”表示沒有。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣東順德中山大學卡內基梅隆大學國際聯合研究院;廣東藥學院;中山大學,未經廣東順德中山大學卡內基梅隆大學國際聯合研究院;廣東藥學院;中山大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510494047.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種設有排水隔氣裝置的恒溫恒濕試驗箱
- 下一篇:一種微波反應裝置
- 同類專利
- 專利分類
G06F 電數字數據處理
G06F19-00 專門適用于特定應用的數字計算或數據處理的設備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質相關的數據處理方法或系統
G06F19-12 ..用于系統生物學的建模或仿真,例如:概率模型或動態模型,遺傳基因管理網絡,蛋白質交互作用網絡或新陳代謝作用網絡
G06F19-14 ..用于發展或進化的,例如:進化的保存區域決定或進化樹結構
G06F19-16 ..用于分子結構的,例如:結構排序,結構或功能關系,蛋白質折疊,結構域拓撲,用結構數據的藥靶,涉及二維或三維結構的
G06F19-18 ..用于功能性基因組學或蛋白質組學的,例如:基因型–表型關聯,不均衡連接,種群遺傳學,結合位置鑒定,變異發生,基因型或染色體組的注釋,蛋白質相互作用或蛋白質核酸的相互作用





