[發(fā)明專利]一種用于判斷待處理多肽與陽性數(shù)據(jù)集肽段相似度的方法有效
| 申請?zhí)枺?/td> | 201911126311.1 | 申請日: | 2019-11-18 |
| 公開(公告)號: | CN110970090B | 公開(公告)日: | 2021-06-29 |
| 發(fā)明(設(shè)計)人: | 薛宇;蔣沛然;寧萬山;傅振遠(yuǎn);郭亞萍;譚瀟丹 | 申請(專利權(quán))人: | 華中科技大學(xué) |
| 主分類號: | G16B30/10 | 分類號: | G16B30/10 |
| 代理公司: | 華中科技大學(xué)專利中心 42201 | 代理人: | 許恒恒;李智 |
| 地址: | 430074 湖北*** | 國省代碼: | 湖北;42 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 用于 判斷 處理 多肽 陽性 數(shù)據(jù) 集肽段 相似 方法 | ||
本發(fā)明公開了一種用于判斷待處理多肽與陽性數(shù)據(jù)集肽段相似度的方法,包括以下步驟:(1)收集修飾位點信息;(2)位置權(quán)重訓(xùn)練與矩陣突變訓(xùn)練;(3)數(shù)據(jù)質(zhì)量權(quán)重的訓(xùn)練;(4)實際測試。本發(fā)明通過對判斷方法整體處理流程的設(shè)計、以及關(guān)于數(shù)據(jù)質(zhì)量權(quán)重的設(shè)置并控制其訓(xùn)練計算過程等進行改進,尤其通過引入數(shù)據(jù)質(zhì)量權(quán)重,能夠計算出精確的相似性的矩陣,一方面為預(yù)測待處理多肽在中心位置附近發(fā)生特定修飾的可能性大小提供了一種新方法,另一方面,通過將該方法進一步與其他基于已知方法的相似度判斷方法進行并列作為備用判斷方法來源,相應(yīng)得到多圖像表征模型的蛋白質(zhì)翻譯后修飾位點預(yù)測方法。
技術(shù)領(lǐng)域
本發(fā)明屬于生物信息學(xué)領(lǐng)域,更具體地,涉及一種用于判斷待處理多肽與陽性數(shù)據(jù)集肽段相似度的方法,能夠預(yù)測蛋白質(zhì)翻譯后修飾位點,同時還涵蓋了對應(yīng)系統(tǒng)及基于該方法的多圖像表征模型修飾位點預(yù)測方法及系統(tǒng)。
背景技術(shù)
蛋白質(zhì)翻譯后修飾是真核和原核生物最重要的機制之一,它涉及化學(xué)基團與蛋白質(zhì)氨基酸側(cè)鏈的連接。各種蛋白質(zhì)翻譯后修飾(PTM)在多種細(xì)胞過程中發(fā)揮著至關(guān)重要的作用,這些過程調(diào)節(jié)蛋白質(zhì)的功能、物理化學(xué)性質(zhì)、構(gòu)象、穩(wěn)定性和響應(yīng)發(fā)育信號或環(huán)境刺激的分子相互作用。例如,蛋白質(zhì)磷酸化是最普遍存在的蛋白質(zhì)翻譯后修飾PTM,可誘導(dǎo)信號轉(zhuǎn)導(dǎo)和細(xì)胞凋亡;賴氨酸琥珀酰化在代謝途徑中起著至關(guān)重要的作用;蛋白質(zhì)乙酰化和甲基化參與染色質(zhì)重編程和轉(zhuǎn)錄調(diào)控;賴氨酸泛素化介導(dǎo)蛋白質(zhì)降解;蛋白質(zhì)棕櫚酰化可動態(tài)膜蛋白相互作用、轉(zhuǎn)運、分選、活化等。并且,越來越多的研究發(fā)現(xiàn)蛋白質(zhì)翻譯后修飾PTM的失調(diào)與多種疾病(包括癌癥)的發(fā)展和進展有關(guān)。由于各種限制,通過諸如高通量液相色譜/質(zhì)譜(LC-MS)技術(shù)的傳統(tǒng)實驗技術(shù)鑒定蛋白質(zhì)翻譯后修飾位點仍然是低效、昂貴且耗時的。因此,開發(fā)能夠識別蛋白質(zhì)翻譯后修飾位點的處理方法已變得越來越有必要。盡管有多種蛋白質(zhì)翻譯后修飾位點預(yù)測方法,例如,Xue等利用基于肽段相似度打分的方法構(gòu)建了多個蛋白質(zhì)修飾位點的預(yù)測器,Qiu等利用支持向量機構(gòu)建多個蛋白質(zhì)修飾位點的預(yù)測器,但當(dāng)這些方法仍然存在一些缺陷,如:利用一種算法構(gòu)建一個簡化模型無法充分挖掘多類型多特征數(shù)據(jù)的信息。現(xiàn)有的預(yù)測方法僅考慮蛋白質(zhì)的一個或幾個特征,而修飾的發(fā)生往往跟蛋白質(zhì)序列、結(jié)構(gòu)、氨基酸理化性質(zhì)等多個因素有關(guān)。此外,現(xiàn)有預(yù)測方法往往僅使用了傳統(tǒng)的機器學(xué)習(xí)算法,目前基于圖像的深度學(xué)習(xí)算法以及在生物信息學(xué)中展現(xiàn)出可喜的前景,是發(fā)展新的高精度預(yù)測方法的重要方向。
發(fā)明內(nèi)容
針對現(xiàn)有技術(shù)的以上缺陷或改進需求,本發(fā)明的目的在于提供一種用于判斷待處理多肽與陽性數(shù)據(jù)集肽段相似度的方法,其中通過對判斷方法整體處理流程的設(shè)計、以及關(guān)于數(shù)據(jù)質(zhì)量權(quán)重的設(shè)置并控制其訓(xùn)練計算過程等進行改進,尤其通過引入數(shù)據(jù)質(zhì)量權(quán)重,能夠計算出精確的相似性的矩陣,一方面為預(yù)測待處理多肽在中心位置附近發(fā)生特定修飾的可能性大小提供了一種新方法,另一方面,通過將該方法進一步與其他基于已知方法的相似度判斷方法進行并列作為備用判斷方法來源,相應(yīng)得到多圖像表征模型的蛋白質(zhì)翻譯后修飾位點預(yù)測方法,與現(xiàn)有技術(shù)相比能夠有效解決蛋白質(zhì)翻譯后修飾位點預(yù)測方法無法實現(xiàn)有效整合多特征的預(yù)測,且無法高精度預(yù)測不同物種中的蛋白質(zhì)翻譯后修飾的問題。
為實現(xiàn)上述目的,按照本發(fā)明的一個方面,提供了一種用于判斷待處理多肽與陽性數(shù)據(jù)集肽段相似度的方法,其特征在于,包括以下步驟:
(1)收集修飾位點信息:基于預(yù)先設(shè)定的某一種特定類型的蛋白質(zhì)翻譯后修飾,收集蛋白質(zhì)翻譯后這些特定類型的修飾位點信息,下載得到蛋白質(zhì)的一級序列;然后,將一級序列中滿足特定類型的修飾位點在蛋白質(zhì)上的對應(yīng)位點標(biāo)記為陽性位點,將一級序列中排除這些陽性位點、且與這些陽性位點所對應(yīng)的氨基酸種類相同的氨基酸位點標(biāo)記為陰性位點;接著,分別以各個陽性位點和各個陰性位點為中心,對蛋白質(zhì)的一級序列進行切割,形成:
(a)以某個陽性位點為中心,且包括緊鄰該中心的上游n個氨基酸、及下游n個氨基酸的總長度為2n+1個氨基酸的序列,從而得到與該陽性位點相對應(yīng)的陽性數(shù)據(jù);以及
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于華中科技大學(xué),未經(jīng)華中科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911126311.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 口服鹿瓜多肽組合物及其制備方法
- 具有提高的產(chǎn)量相關(guān)性狀的植物和用于制備該植物的方法
- 用于增加多肽穩(wěn)定性和活性的組合物及相關(guān)方法
- 具有增強的產(chǎn)量相關(guān)性狀的植物和用于產(chǎn)生該植物的方法
- 檢測可食用肉的特征多肽及方法
- 一種用于免疫接種的組合物及其制備方法
- 一種通過調(diào)節(jié)酸堿度控制多肽晶體可逆組裝的方法
- 一類促進豬機體產(chǎn)生非洲豬瘟病毒抗原特異性免疫應(yīng)答的多肽及其應(yīng)用
- 一類促進豬機體產(chǎn)生非洲豬瘟病毒抗原特異性免疫應(yīng)答的多肽及其應(yīng)用
- 一類促進豬機體產(chǎn)生廣譜性免疫應(yīng)答的多肽及其應(yīng)用





