[發明專利]基于加權組成位置向量和支持向量機的蛋白質結構類預測方法在審
| 申請號: | 201510429363.1 | 申請日: | 2015-07-21 |
| 公開(公告)號: | CN105205343A | 公開(公告)日: | 2015-12-30 |
| 發明(設計)人: | 鄒小勇;周喜斌;李占潮;戴宗 | 申請(專利權)人: | 廣東順德中山大學卡內基梅隆大學國際聯合研究院;中山大學 |
| 主分類號: | G06F19/12 | 分類號: | G06F19/12 |
| 代理公司: | 廣州粵高專利商標代理有限公司 44102 | 代理人: | 林麗明 |
| 地址: | 528399 廣東省佛山市*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 加權 組成 位置 向量 支持 蛋白質 結構 預測 方法 | ||
1.一種基于加權組成位置向量和支持向量機的蛋白質結構類預測方法,其特征在于,包括以下步驟:
S1.選取或構建蛋白質結構類標準數據集;
S2.用加權組成位置向量的蛋白質序列表征方法表征步驟S1數據集中的每一條蛋白質序列,加權組成位置向量可以表示如下:
X=(c1,c2,…,c20,c′1,c′2,…,c′20)T
X是40維特征向量,前20個元素是氨基酸組成,后20個元素是加權的位置向量,計算如下:
式中,w為權重因子,為一大于0的整數
L是蛋白質序列的長度;
l是第i種氨基酸在蛋白質序列中出現的次數;
pij是第i種氨基酸在蛋白質序列中所處的第j個位置;
S3.將加權組成位置向量與支持向量機結合,采用直接的多類分類策略,預測蛋白質結構。
2.根據權利要求1所述的基于加權組成位置向量和支持向量機的蛋白質結構類預測方法,其特征在于,針對不同的數據集,所述w的最優值不同。
3.根據權利要求2所述的基于加權組成位置向量和支持向量機的蛋白質結構類預測方法,其特征在于,使用5折交叉方法驗證選擇w的最優值。
4.根據權利要求1所述的基于加權組成位置向量和支持向量機的蛋白質結構類預測方法,其特征在于,步驟S3選取徑向基核函數來建立預測模型,g為徑向基寬度參數。
5.根據權利要求4所述的基于加權組成位置向量和支持向量機的蛋白質結構類預測方法,其特征在于,徑向基寬度參數g通過5-折交叉驗證優化選擇。
6.根據權利要求4所述的基于加權組成位置向量和支持向量機的蛋白質結構類預測方法,其特征在于,懲罰參數C通過5-折交叉驗證優化選擇。
7.根據權利要求1所述的基于加權組成位置向量和支持向量機的蛋白質結構類預測方法,其特征在于,利用軟件包LibSVM完成支持向量機的計算。
8.權利要求1~7任一所述方法在蛋白質預測中的應用。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣東順德中山大學卡內基梅隆大學國際聯合研究院;中山大學,未經廣東順德中山大學卡內基梅隆大學國際聯合研究院;中山大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510429363.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種指紋識別方法
- 下一篇:一種基于客戶訴求的電力配網改造需求模型構建方法
- 同類專利
- 專利分類
G06F 電數字數據處理
G06F19-00 專門適用于特定應用的數字計算或數據處理的設備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質相關的數據處理方法或系統
G06F19-12 ..用于系統生物學的建模或仿真,例如:概率模型或動態模型,遺傳基因管理網絡,蛋白質交互作用網絡或新陳代謝作用網絡
G06F19-14 ..用于發展或進化的,例如:進化的保存區域決定或進化樹結構
G06F19-16 ..用于分子結構的,例如:結構排序,結構或功能關系,蛋白質折疊,結構域拓撲,用結構數據的藥靶,涉及二維或三維結構的
G06F19-18 ..用于功能性基因組學或蛋白質組學的,例如:基因型–表型關聯,不均衡連接,種群遺傳學,結合位置鑒定,變異發生,基因型或染色體組的注釋,蛋白質相互作用或蛋白質核酸的相互作用





