[發(fā)明專利]預(yù)測氨基酸變異對蛋白質(zhì)結(jié)構(gòu)穩(wěn)定性影響的系統(tǒng)及其方法在審
| 申請?zhí)枺?/td> | 201710533801.8 | 申請日: | 2017-07-03 |
| 公開(公告)號: | CN107358064A | 公開(公告)日: | 2017-11-17 |
| 發(fā)明(設(shè)計)人: | 楊洋;朱斐;嚴文穎;錢福良;郁春江 | 申請(專利權(quán))人: | 蘇州大學(xué) |
| 主分類號: | G06F19/24 | 分類號: | G06F19/24 |
| 代理公司: | 上海申新律師事務(wù)所31272 | 代理人: | 閔東 |
| 地址: | 215000 江蘇*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 預(yù)測 氨基酸 變異 蛋白質(zhì) 結(jié)構(gòu) 穩(wěn)定性 影響 系統(tǒng) 及其 方法 | ||
1.一種預(yù)測氨基酸變異對蛋白質(zhì)結(jié)構(gòu)穩(wěn)定性影響的系統(tǒng),其特征在于:由氨基酸變異信息輸入模塊(1)、氨基酸變異位點屬性計算模塊(2)、蛋白質(zhì)序列屬性計算模塊(3)、預(yù)測穩(wěn)定性變化模塊(4)、預(yù)測結(jié)果輸出模塊(5)組成,其中,所述氨基酸變異信息輸入模塊(1)分別與所述氨基酸變異位點屬性計算模塊(2)和所述蛋白質(zhì)序列屬性計算模塊(3)連接,所述氨基酸變異位點屬性計算模塊(2)和所述蛋白質(zhì)序列屬性計算模塊(3)同時與所述預(yù)測穩(wěn)定性變化模塊(4)連接,所述預(yù)測穩(wěn)定性變化模塊(4)與所述預(yù)測結(jié)果輸出模塊(5)連接;
所述氨基酸變異信息輸入模塊(1)的功能為獲取用戶提交的單個或成組的氨基酸變異及其蛋白質(zhì)序列,并進行用戶信息及數(shù)據(jù)的存儲;
所述氨基酸變異位點屬性計算模塊(2)的功能為根據(jù)野生型和變異型位點上的氨基酸情況,提取相對應(yīng)的AAindex屬性特征值,并根據(jù)氨基酸變異數(shù)據(jù),計算變異后的氨基酸位點物理化學(xué)屬性特征;
所述蛋白質(zhì)序列屬性計算模塊(3)的功能為根據(jù)氨基酸變異數(shù)據(jù)計算相關(guān)蛋白質(zhì)的保守性以及蛋白質(zhì)屬性特征;
所述預(yù)測穩(wěn)定性變化模塊(4)的功能為通過基于隨機森林的兩層三分類算法將氨基酸變異對蛋白質(zhì)穩(wěn)定性的影響進行計算和分類,并給出相應(yīng)概率,作為預(yù)測結(jié)果;
所述預(yù)測結(jié)果輸出模塊(5)的功能為將預(yù)測結(jié)果生成excel和pdf文件形式,存儲并自動郵件發(fā)送用戶,同時支持用戶查詢統(tǒng)計。
2.一種利用如權(quán)利要求1所述的系統(tǒng)的預(yù)測氨基酸變異對蛋白質(zhì)結(jié)構(gòu)穩(wěn)定性影響的方法,其特征在于,包括以下步驟:
步驟1)所述氨基酸變異信息輸入模塊(1)首先根據(jù)用戶輸入的氨基酸變異信息,獲取其中的氨基酸變異及其蛋白質(zhì)序列,然后所述氨基酸變異信息輸入模塊(1)將獲取到的氨基酸變異數(shù)據(jù)以及與氨基酸變異對應(yīng)的蛋白質(zhì)序列數(shù)據(jù)分別傳輸至所述氨基酸變異位點屬性計算模塊(2)和所述蛋白質(zhì)序列屬性計算模塊(3),同時,所有輸入數(shù)據(jù)以及提交數(shù)據(jù)的用戶信息將被系統(tǒng)存儲;
步驟2)在收到所述氨基酸變異數(shù)據(jù)后,所述氨基酸變異位點屬性計算模塊(2)一方面從AAindex數(shù)據(jù)庫中,根據(jù)野生型和變異型位點上的氨基酸情況,提取相對應(yīng)的AAindex屬性特征值,另一方面以該氨基酸變異位點為中心,計算相鄰位點中各類氨基酸的分布情況,并換算成相應(yīng)的氨基酸位點物理化學(xué)屬性特征;然后,所述氨基酸變異位點屬性計算模塊(2)將提取到的所述AAindex屬性特征值和計算出的所述氨基酸位點物理化學(xué)屬性特征同時傳輸至所述預(yù)測穩(wěn)定性變化模塊(4);
步驟3)在收到所述與氨基酸變異對應(yīng)的蛋白質(zhì)序列數(shù)據(jù)后,所述蛋白質(zhì)序列屬性計算模塊(3)一方面調(diào)用BLAST方法尋找該蛋白質(zhì)序列的同源序列,然后構(gòu)造PSSM矩陣,計算該蛋白質(zhì)序列的保守性,作為預(yù)測的輸入屬性特征;另一方面調(diào)用ProtDCal算法,計算該蛋白質(zhì)序列的蛋白質(zhì)屬性特征;然后,所述蛋白質(zhì)序列屬性計算模塊(3)將計算出的該蛋白質(zhì)序列的保守性和蛋白質(zhì)屬性同時傳輸至所述預(yù)測穩(wěn)定性變化模塊(4);
步驟4)在收到所述AAindex屬性特征值、所述氨基酸位點物理化學(xué)屬性特征、所述蛋白質(zhì)序列的保守性以及所述蛋白質(zhì)屬性特征后,所述預(yù)測穩(wěn)定性變化模塊(4)采用基于隨機森林的兩層三分類模型預(yù)測方法,將氨基酸變異對蛋白質(zhì)結(jié)構(gòu)穩(wěn)定性的影響歸為影響蛋白質(zhì)穩(wěn)定性降低、升高和不變?nèi)愔械囊活悾⒂嬎愠鱿鄳?yīng)的概率,作為預(yù)測結(jié)果;然后,所述預(yù)測穩(wěn)定性變化模塊(4)將計算出的所述預(yù)測結(jié)果傳輸至所述預(yù)測結(jié)果輸出模塊(5);
步驟5)在收到所述據(jù)測結(jié)果后,所述預(yù)測結(jié)果輸出模塊(5)首先將所述預(yù)測結(jié)果進行存儲,然后將所述預(yù)測結(jié)果生成excel和pdf文件形式,并按照任務(wù)發(fā)送郵件給對應(yīng)的提交數(shù)據(jù)的用戶;對于注冊系統(tǒng)的用戶,可輸入任務(wù)名稱以查看對應(yīng)的預(yù)測結(jié)果,或輸入某一個特定蛋白質(zhì),統(tǒng)計其上面所有變異對穩(wěn)定性產(chǎn)生的影響。
3.根據(jù)權(quán)利要求2所述的預(yù)測氨基酸變異對蛋白質(zhì)結(jié)構(gòu)穩(wěn)定性影響的方法,其特征在于,步驟1)中,輸入氨基酸變異信息的方法具體包括以下三種方式:
1)輸入單個變異及變異所在的蛋白質(zhì)序列、實驗溫度和pH值;
2)一次批量輸入多個氨基酸變異及每個變異對應(yīng)的蛋白質(zhì)序列、實驗溫度和pH值;
3)輸入指定的蛋白質(zhì)序列、實驗溫度和pH值。
4.根據(jù)權(quán)利要求2所述的預(yù)測氨基酸變異對蛋白質(zhì)結(jié)構(gòu)穩(wěn)定性影響的方法,其特征在于,步驟4)中,所述的基于隨機森林的兩層三分類模型預(yù)測方法的具體步驟如下:
1)按照所述氨基酸變異位點屬性計算模塊(2)和所述蛋白質(zhì)序列屬性計算模塊(3)中的計算方法以及特征提取算法,分別構(gòu)造兩個基于隨機森林的分類預(yù)測器,第一個分類預(yù)測器將氨基酸變異分為導(dǎo)致蛋白質(zhì)穩(wěn)定性降低和不降低兩類;第二個分類預(yù)測器將變異分為導(dǎo)致蛋白質(zhì)穩(wěn)定性升高和不變兩類;
2)對所有待預(yù)測的氨基酸變異數(shù)據(jù)分別抽取對應(yīng)的輸入屬性、運用所述第一個分類預(yù)測器,將氨基酸變異分類成導(dǎo)致蛋白質(zhì)穩(wěn)定性降低和不降低兩類;
3)對上一步中被預(yù)測為導(dǎo)致蛋白質(zhì)穩(wěn)定性不降低的變異數(shù)據(jù),再次抽取相應(yīng)的輸入屬性,運用所述第二個分類預(yù)測器,將這部分氨基酸變異分類為導(dǎo)致蛋白質(zhì)穩(wěn)定性升高和不變兩類;由此,待預(yù)測的氨基酸變異就被分為了影響蛋白質(zhì)穩(wěn)定性降低、升高和不變?nèi)悺?!-- SIPO
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于蘇州大學(xué),未經(jīng)蘇州大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710533801.8/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字數(shù)據(jù)處理
G06F19-00 專門適用于特定應(yīng)用的數(shù)字計算或數(shù)據(jù)處理的設(shè)備或方法
G06F19-10 .生物信息學(xué),即計算分子生物學(xué)中的遺傳或蛋白質(zhì)相關(guān)的數(shù)據(jù)處理方法或系統(tǒng)
G06F19-12 ..用于系統(tǒng)生物學(xué)的建模或仿真,例如:概率模型或動態(tài)模型,遺傳基因管理網(wǎng)絡(luò),蛋白質(zhì)交互作用網(wǎng)絡(luò)或新陳代謝作用網(wǎng)絡(luò)
G06F19-14 ..用于發(fā)展或進化的,例如:進化的保存區(qū)域決定或進化樹結(jié)構(gòu)
G06F19-16 ..用于分子結(jié)構(gòu)的,例如:結(jié)構(gòu)排序,結(jié)構(gòu)或功能關(guān)系,蛋白質(zhì)折疊,結(jié)構(gòu)域拓撲,用結(jié)構(gòu)數(shù)據(jù)的藥靶,涉及二維或三維結(jié)構(gòu)的
G06F19-18 ..用于功能性基因組學(xué)或蛋白質(zhì)組學(xué)的,例如:基因型–表型關(guān)聯(lián),不均衡連接,種群遺傳學(xué),結(jié)合位置鑒定,變異發(fā)生,基因型或染色體組的注釋,蛋白質(zhì)相互作用或蛋白質(zhì)核酸的相互作用
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法、程序以及記錄介質(zhì)
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 基于時間序列預(yù)測模型適用性量化的預(yù)測模型選擇方法
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 分類預(yù)測方法及裝置、預(yù)測模型訓(xùn)練方法及裝置
- 幀內(nèi)預(yù)測的方法及裝置
- 圖像預(yù)測方法及裝置、電子設(shè)備和存儲介質(zhì)
- 文本預(yù)測方法、裝置以及電子設(shè)備
- 模型融合方法、預(yù)測方法、裝置、設(shè)備及存儲介質(zhì)





