[發明專利]一種篩選和/或設計針對多靶標的藥物的方法有效
| 申請號: | 201110174760.0 | 申請日: | 2011-06-27 |
| 公開(公告)號: | CN102222178A | 公開(公告)日: | 2011-10-19 |
| 發明(設計)人: | 蔣宇揚;陳宇綜;馬曉華 | 申請(專利權)人: | 清華大學深圳研究生院 |
| 主分類號: | G06F19/24 | 分類號: | G06F19/24;G06F19/16 |
| 代理公司: | 北京紀凱知識產權代理有限公司 11245 | 代理人: | 關暢;任鳳華 |
| 地址: | 518055 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 篩選 設計 針對 靶標 藥物 方法 | ||
技術領域
本發明涉及一種篩選和/或設計針對多靶標的藥物的方法。
背景技術
目前,已有許多計算方法用于針對單一靶點的藥物分子設計,一些已經廣泛應用于單靶點藥物先導化合物的發現。其中,最常見的計算方法包括分子對接,藥效團方法,構效關系(SAR),定量構效關系(QSAR),相似性搜索,機器學習以及以上幾種方法的聯合應用。最近,主要在基于片段拼接方式和組合方法方式的基礎上,以上一些計算方法被發展用于多靶點先導化合物的發現。基于片段拼接的方式是把分別靶向于不同靶點的兩個分子的骨架鍵連起來,組成一個單一分子,但仍保留對原有各自靶點的活性。而組合方法方式則是通過平行應用某一計算方法篩選作用于單靶標的分子,從中選出那些能同時靶向于多靶點的活性先導物。
不過,以上幾個方法所采用的參數或訓練集都不是專門用于篩選多靶點分子的,它們主要是針對單一靶點的計算機虛擬篩選方法。例如,分子對接的方法主要基于單分子對單分子之間的力場、統計得出的單分子對單分子之間相互作用以及分子間的結合函數。分子對接可以測試分子對單一靶點的活性而不能確定它們對多個靶點可能存在的活性。同樣,定量構效關系模型,藥效團模型,機器學習回歸分析以及分類模型等方法,則是通過把對單一靶點具有活性的分子分成訓練集和測試集,雖已被證實對單一靶點有效果,但依然不能確定對多個靶點是否具有活性。對選定的多個靶點均具有活性的多靶點分子數量不足單一靶點活性分子數量的十分之一。因此,在訓練集和測試集中單一靶點活性分子占據著絕對的多數。那些用于建立虛擬篩選模型的參數與特征以及模型的預測能力都被證實對訓練集的分子組成相當敏感。因此,有必要利用已知多靶點分子對選定靶點的一些特征來開發用于篩選和發現多靶活性分子虛擬篩選的模型,可以顯著提高多靶點藥物發現的成功率。
發明內容
本發明的一個目的是提供一種篩選同時靶向作用于若干個靶標的藥物先導物的方法。
本發明所提供的篩選同時靶向作用于若干個靶標的藥物先導物的方法,包括如下步驟:
1)構建訓練集:
針對k個靶標,分別記作靶標1、靶標2、…、靶標K,搜尋陽性訓練集和陰性訓練集,K至少為2,具體如下:
在現有技術中的數據中搜尋能同時作用于所述k個靶標的物質,將這一類物質歸為陽性訓練集,記作訓練集A;
在現有技術中的數據中,分別搜尋只作用于靶標1、靶標2、…或靶標K的物質,將針對靶標1、靶標2、…或靶標K的物質分別歸為陰性訓練集,陰性訓練集B1對應靶標1,陰性訓練集B2對應靶標2,…陰性訓練集Bk對應靶標k;
在現有技術中的數據中,搜尋不能作用于靶標1的物質,這一類物質記作訓練集C1;
在現有技術中的數據中,分別搜尋不能作用于靶標1、靶標2、…或靶標K的物質,將針對靶標1、靶標2、…或靶標K的物質分別歸為訓練集C1、訓練集C2、……或訓練集CK;
2)選擇特征群1、特征群2、......、特征群k、特征群1-k
I、選擇特征群1
第一步:建立訓練集
尋找訓練集A針對訓練集B1的多靶點特征,訓練集A和B1表述為{xi,yi}∈Rp×{-1,+1},其中xi表示訓練集A或B1中的樣本的特征矢量,yi表示類標,yi=1表示訓練集A中的樣本,yi=-1表示訓練集B1中的樣本,p表示特征矢量的維數,RP表示位數為P的實數空間。
第二步:建立SVM模型:
SVM首先通過核函數Φ(x)將訓練樣本投影到一個高維空間,并計算決策函數f(x)=<w,Φ(x)>+b。w是超平面的標準向量。
對于線性可分的樣本集,采用線性核函數,并使得:yi[(w·xi)+b]-1≥0,i=1,...,N,在約束條件下最下化目標泛涵。
第三步:建立RFE-SVM特征群選擇數學模型:
考慮第i個特征對目標函數J的影響,由泰勒展開可得:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于清華大學深圳研究生院,未經清華大學深圳研究生院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110174760.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種改良型易碎紙
- 下一篇:用以置入直腸栓劑的裝置及方法
- 同類專利
- 專利分類
G06F 電數字數據處理
G06F19-00 專門適用于特定應用的數字計算或數據處理的設備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質相關的數據處理方法或系統
G06F19-12 ..用于系統生物學的建模或仿真,例如:概率模型或動態模型,遺傳基因管理網絡,蛋白質交互作用網絡或新陳代謝作用網絡
G06F19-14 ..用于發展或進化的,例如:進化的保存區域決定或進化樹結構
G06F19-16 ..用于分子結構的,例如:結構排序,結構或功能關系,蛋白質折疊,結構域拓撲,用結構數據的藥靶,涉及二維或三維結構的
G06F19-18 ..用于功能性基因組學或蛋白質組學的,例如:基因型–表型關聯,不均衡連接,種群遺傳學,結合位置鑒定,變異發生,基因型或染色體組的注釋,蛋白質相互作用或蛋白質核酸的相互作用





