[發(fā)明專利]基于加權(quán)組成位置向量和支持向量機(jī)的蛋白質(zhì)結(jié)構(gòu)類預(yù)測(cè)方法在審
| 申請(qǐng)?zhí)枺?/td> | 201510429363.1 | 申請(qǐng)日: | 2015-07-21 |
| 公開(kāi)(公告)號(hào): | CN105205343A | 公開(kāi)(公告)日: | 2015-12-30 |
| 發(fā)明(設(shè)計(jì))人: | 鄒小勇;周喜斌;李占潮;戴宗 | 申請(qǐng)(專利權(quán))人: | 廣東順德中山大學(xué)卡內(nèi)基梅隆大學(xué)國(guó)際聯(lián)合研究院;中山大學(xué) |
| 主分類號(hào): | G06F19/12 | 分類號(hào): | G06F19/12 |
| 代理公司: | 廣州粵高專利商標(biāo)代理有限公司 44102 | 代理人: | 林麗明 |
| 地址: | 528399 廣東省佛山市*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 加權(quán) 組成 位置 向量 支持 蛋白質(zhì) 結(jié)構(gòu) 預(yù)測(cè) 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明屬于蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)技術(shù)領(lǐng)域,更具體地,涉及一種基于加權(quán)組成位置向量的蛋白質(zhì)結(jié)構(gòu)類預(yù)測(cè)方法。
背景技術(shù)
蛋白質(zhì)的三維結(jié)構(gòu)十分復(fù)雜,只有折疊成正確的空間結(jié)構(gòu)才能行使其生物功能。蛋白質(zhì)整體折疊模式(foldingpattern)可以通過(guò)蛋白質(zhì)結(jié)構(gòu)類來(lái)進(jìn)行描述,主要包括四種,即全a、全b、a/b和a+b。其中全a類中主要包含的二級(jí)結(jié)構(gòu)單元為a螺旋(a-helix),全b類主要包含的二級(jí)結(jié)構(gòu)單元為b折疊(b-sheet),a/b類同時(shí)包含a螺旋和b折疊,并且b折疊片的走向主要為平行,a+b類也同時(shí)包含a螺旋和b折疊,但是b折疊片的走向主要為反向平行。結(jié)構(gòu)類是蛋白質(zhì)的主要性質(zhì)之一,對(duì)于蛋白質(zhì)結(jié)構(gòu)類的預(yù)測(cè),將有助于提高蛋白質(zhì)二級(jí)結(jié)構(gòu)和三級(jí)結(jié)構(gòu)的預(yù)測(cè)率,對(duì)于研究蛋白質(zhì)結(jié)構(gòu)與功能關(guān)系,具有重要的理論意義和實(shí)用價(jià)值。
在蛋白質(zhì)結(jié)構(gòu)類預(yù)測(cè)模型的構(gòu)建中,蛋白質(zhì)序列表征方法是影響模型預(yù)測(cè)性能的關(guān)鍵。氨基酸組成是一種簡(jiǎn)單、有效的蛋白質(zhì)序列表征方法,通過(guò)氨基酸組成,蛋白質(zhì)序列可以表征為一個(gè)20維的離散向量。事實(shí)上,許多預(yù)測(cè)方法都是基于蛋白質(zhì)的氨基酸組成提出的。然而,用氨基酸組成來(lái)表征蛋白質(zhì)序列會(huì)丟失氨基酸殘基之間的順序信息,氨基酸組成表征方法無(wú)法區(qū)分氨基酸組成相同而排列次序不同的蛋白質(zhì)序列,限制了預(yù)測(cè)方法性能的提高。因此,近年來(lái)研究者們又提出了許多新的蛋白質(zhì)序列表征方法,包括:偽氨基酸組成、氨基酸對(duì)耦合組成、多肽組成、功能域組成以及其他的蛋白質(zhì)表征方法。隨著后基因組時(shí)代的來(lái)臨,序列已知的蛋白質(zhì)數(shù)目以及結(jié)構(gòu)類已知的蛋白質(zhì)數(shù)目之間的差距正在不斷擴(kuò)大。為了縮小這種差距,提高蛋白質(zhì)結(jié)構(gòu)類的預(yù)測(cè)率,建立新的蛋白質(zhì)表征方法屬研究熱點(diǎn),發(fā)展自動(dòng)、可靠的預(yù)測(cè)方法意義重大。
發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問(wèn)題是克服現(xiàn)有技術(shù)的不足,提供一種新的簡(jiǎn)單、快速、靈敏的蛋白質(zhì)序列表征方法——加權(quán)組成位置向量,在組成位置向量的基礎(chǔ)上,引入加權(quán)思想,與支持向量機(jī)結(jié)合,采用直接多類分類策略,對(duì)蛋白質(zhì)結(jié)構(gòu)類預(yù)測(cè)進(jìn)行了研究,有望應(yīng)用于其它蛋白質(zhì)預(yù)測(cè)領(lǐng)域。該表征方法不僅含有氨基酸組成的信息,而且還包含了蛋白質(zhì)序列中每個(gè)氨基酸殘基的位置信息,并且與蛋白質(zhì)序列之間是一一對(duì)應(yīng)的函數(shù)關(guān)系,該方法通過(guò)調(diào)節(jié)加權(quán)因子可以明顯地提高預(yù)測(cè)精度,預(yù)測(cè)結(jié)果優(yōu)于文獻(xiàn)報(bào)道的多數(shù)方法。
本發(fā)明的目的是提供一種基于加權(quán)組成位置向量的蛋白質(zhì)結(jié)構(gòu)類預(yù)測(cè)方法。
本發(fā)明上述目的是通過(guò)以下技術(shù)方案予以實(shí)現(xiàn):
一種基于加權(quán)組成位置向量和支持向量機(jī)的蛋白質(zhì)結(jié)構(gòu)類預(yù)測(cè)方法,包括以下步驟:
S1.選取或構(gòu)建蛋白質(zhì)結(jié)構(gòu)類標(biāo)準(zhǔn)數(shù)據(jù)集;
S2.用加權(quán)組成位置向量的蛋白質(zhì)序列表征方法表征步驟S1數(shù)據(jù)集中的每一條蛋白質(zhì)序列,加權(quán)組成位置向量可以表示如下:
X=(c1,c2,…,c20,c1,c2,…,c20)T
X是40維特征向量,前20個(gè)元素是氨基酸組成,后20個(gè)元素是加權(quán)的位置向量,計(jì)算如下:
式中,w為權(quán)重因子,為一大于0的整數(shù);
L是蛋白質(zhì)序列的長(zhǎng)度;
l是第i種氨基酸在蛋白質(zhì)序列中出現(xiàn)的次數(shù);
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣東順德中山大學(xué)卡內(nèi)基梅隆大學(xué)國(guó)際聯(lián)合研究院;中山大學(xué),未經(jīng)廣東順德中山大學(xué)卡內(nèi)基梅隆大學(xué)國(guó)際聯(lián)合研究院;中山大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510429363.1/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F19-00 專門適用于特定應(yīng)用的數(shù)字計(jì)算或數(shù)據(jù)處理的設(shè)備或方法
G06F19-10 .生物信息學(xué),即計(jì)算分子生物學(xué)中的遺傳或蛋白質(zhì)相關(guān)的數(shù)據(jù)處理方法或系統(tǒng)
G06F19-12 ..用于系統(tǒng)生物學(xué)的建模或仿真,例如:概率模型或動(dòng)態(tài)模型,遺傳基因管理網(wǎng)絡(luò),蛋白質(zhì)交互作用網(wǎng)絡(luò)或新陳代謝作用網(wǎng)絡(luò)
G06F19-14 ..用于發(fā)展或進(jìn)化的,例如:進(jìn)化的保存區(qū)域決定或進(jìn)化樹(shù)結(jié)構(gòu)
G06F19-16 ..用于分子結(jié)構(gòu)的,例如:結(jié)構(gòu)排序,結(jié)構(gòu)或功能關(guān)系,蛋白質(zhì)折疊,結(jié)構(gòu)域拓?fù)洌媒Y(jié)構(gòu)數(shù)據(jù)的藥靶,涉及二維或三維結(jié)構(gòu)的
G06F19-18 ..用于功能性基因組學(xué)或蛋白質(zhì)組學(xué)的,例如:基因型–表型關(guān)聯(lián),不均衡連接,種群遺傳學(xué),結(jié)合位置鑒定,變異發(fā)生,基因型或染色體組的注釋,蛋白質(zhì)相互作用或蛋白質(zhì)核酸的相互作用
- 位置檢測(cè)裝置、位置檢測(cè)電路及位置檢測(cè)方法
- 位置估計(jì)設(shè)備、位置估計(jì)方法、以及位置估計(jì)系統(tǒng)
- 位置檢測(cè)裝置、位置檢測(cè)方法及位置檢測(cè)程序
- 位置辨識(shí)裝置、位置辨識(shí)系統(tǒng)以及位置辨識(shí)方法
- 位置指示器、位置檢測(cè)裝置、位置檢測(cè)電路以及位置檢測(cè)方法
- 位置檢測(cè)裝置、位置檢測(cè)系統(tǒng)以及位置檢測(cè)方法
- 位置檢測(cè)裝置、位置檢測(cè)系統(tǒng)以及位置檢測(cè)方法
- 位置檢測(cè)裝置、位置檢測(cè)方法以及位置檢測(cè)系統(tǒng)
- 位置估計(jì)方法、位置估計(jì)裝置、以及位置估計(jì)系統(tǒng)
- 位置檢測(cè)方法、位置檢測(cè)裝置以及位置檢測(cè)系統(tǒng)





