[發明專利]一種基于自加權多核學習的藥物副作用識別方法有效
| 申請號: | 202010280936.X | 申請日: | 2020-04-10 |
| 公開(公告)號: | CN111477344B | 公開(公告)日: | 2023-06-09 |
| 發明(設計)人: | 劉勇國;李楊;楊尚明;李巧勤 | 申請(專利權)人: | 電子科技大學 |
| 主分類號: | G16H70/40 | 分類號: | G16H70/40;G16B15/30;G16B40/00;G16C20/50;G16C20/70;G16C20/90 |
| 代理公司: | 成都行之專利代理事務所(普通合伙) 51220 | 代理人: | 李朝虎 |
| 地址: | 610000 四川省成*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 加權 多核 學習 藥物 副作用 識別 方法 | ||
1.一種基于自加權多核學習的藥物副作用識別方法,其特征在于,包括以下步驟:
步驟1:數據獲取:自數據庫收集信息;所述自數據庫收集信息包括同時具有靶向蛋白和副作用信息的藥物信息、藥物-蛋白質相互作用信息,靶向蛋白信息、藥物副作用關系信息,副作用信息;數據來源于Mizutani數據庫,所述Mizutani數據庫收集了同時具有靶向蛋白和副作用信的658種藥物信息、5074種藥物-蛋白質相互作用,1368種靶向蛋白、49051種藥物副作用關系,1339種副作用;
步驟2:基于步驟1的數據進行藥物核矩陣和副作用核矩陣的構建:構建表示藥物種類的數據集合,構建副作用種類的數據集合,構建藥物與副作用之間的關系矩陣;
計算所述關系矩陣的四種相似性數據,四種相似性數據分別為高斯相互作用屬性核(GIP)、相關系數核(Corr)、余弦相似度核(COS)和互信息核(MI),根據計算得到的四種相似性數據生成藥物屬性空間的核矩陣和副作用屬性空間的核矩陣;
步驟3:依據步驟2得到的藥物屬性空間的核矩陣和副作用屬性空間的核矩陣,建立自加權的多核學習的目標函數,迭代更新得到藥物最優核矩陣和副作用最優核矩陣,應用最近鄰的方法擴展藥物屬性空間的核矩陣和副作用屬性空間的核矩陣,此時,應用高斯場和調和函數方法最小化目標函數,不斷迭代更新,最終得到預測的藥物副作用關系矩陣。
2.根據權利要求1所述的一種基于自加權多核學習的藥物副作用識別方法,其特征在于,所述步驟2中還包括以下步驟,使用藥物-子結構關系矩陣生成四種藥物屬性核,使用藥物-靶點關系矩陣生成四種藥物屬性核,將這八種藥物屬性核與使用藥物-副作用關系矩陣生成的四種藥物屬性核一同代入到步驟3中計算。
3.根據權利要求1所述的一種基于自加權多核學習的藥物副作用識別方法,其特征在于,所述藥物的化學結構編碼采用分子指紋,所述分子指紋由PubChem數據庫中定義的多種化學子結構組成。
4.根據權利要求3所述的一種基于自加權多核學習的藥物副作用識別方法,其特征在于,所述步驟2包括以下詳細步驟:
用D={d1,d2,…,dn}表示n種藥物的集合,d表示藥物,S={s1,s2,…,sm}表示m種副作用的集合,s表示副作用;
n×m的鄰接矩陣F表示藥物和副作用之間的關系矩陣,Fi.j(1≤i≤n,1≤j≤m)是F鄰接矩陣的元素,當藥物di存在副作用sj時,Fi.j=1;否則,Fi.j=0,對于藥物di,使用副作用表示為Fdi,是一個長度為m的二元向量,向量中每一個元素的值為1或者0;
高斯相互作用屬性核(GIP)具體表示為:
和分別是使用副作用表示的藥物di和藥物dk的二元向量,γ表示高斯核的帶寬;
相關系數核(Corr)表示為:
表示為與的協方差,表示為的方差,表示為的方差;
余弦相似度核(COS)表示為:
互信息核(MI)表示為:
u∈0,1并且v∈0,1,對于在副作用空間上的藥物變量,0表示藥物沒有該副作用,1表示藥物有該副作用,f(u)表示u在中的可觀測的頻率,f(v)表示v在中的可觀測的頻率,f(u,v)表示相對觀測的頻率。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于電子科技大學,未經電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010280936.X/1.html,轉載請聲明來源鉆瓜專利網。





