[發(fā)明專利]預(yù)測(cè)氨基酸變異對(duì)蛋白質(zhì)結(jié)構(gòu)穩(wěn)定性影響的系統(tǒng)及其方法在審
| 申請(qǐng)?zhí)枺?/td> | 201710533801.8 | 申請(qǐng)日: | 2017-07-03 |
| 公開(公告)號(hào): | CN107358064A | 公開(公告)日: | 2017-11-17 |
| 發(fā)明(設(shè)計(jì))人: | 楊洋;朱斐;嚴(yán)文穎;錢福良;郁春江 | 申請(qǐng)(專利權(quán))人: | 蘇州大學(xué) |
| 主分類號(hào): | G06F19/24 | 分類號(hào): | G06F19/24 |
| 代理公司: | 上海申新律師事務(wù)所31272 | 代理人: | 閔東 |
| 地址: | 215000 江蘇*** | 國(guó)省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 預(yù)測(cè) 氨基酸 變異 蛋白質(zhì) 結(jié)構(gòu) 穩(wěn)定性 影響 系統(tǒng) 及其 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明屬于生物醫(yī)學(xué)數(shù)據(jù)分析技術(shù)領(lǐng)域,具體涉及一種預(yù)測(cè)氨基酸變異對(duì)蛋白質(zhì)結(jié)構(gòu)穩(wěn)定性影響的系統(tǒng)及其方法。
背景技術(shù)
預(yù)測(cè)氨基酸變異對(duì)蛋白質(zhì)穩(wěn)定性影響的重要指標(biāo)是野生型蛋白質(zhì)和變異后蛋白質(zhì)的自由能變化值ddG。目前已有的預(yù)測(cè)方法分為兩種:一種是直接基于能量用物理公式計(jì)算,但由于蛋白質(zhì)物理結(jié)構(gòu)的不明確,這樣計(jì)算結(jié)果并不準(zhǔn)確,且泛化性弱;
另一種是基于已有實(shí)驗(yàn)數(shù)據(jù),運(yùn)用機(jī)器學(xué)習(xí)的方法來(lái)預(yù)測(cè),但這種方法會(huì)存在以下這些問(wèn)題:
(1)準(zhǔn)確性差,目前通用的實(shí)驗(yàn)數(shù)據(jù)庫(kù)Protherm中的數(shù)據(jù)錯(cuò)、漏較多,導(dǎo)致訓(xùn)練數(shù)據(jù)集質(zhì)量差,嚴(yán)重影響預(yù)測(cè)結(jié)果的準(zhǔn)確性;
(2)泛化性差,該方法使用了大量蛋白質(zhì)結(jié)構(gòu)相關(guān)的輸入屬性,但對(duì)于蛋白質(zhì)結(jié)構(gòu)未知的情況,則無(wú)法預(yù)測(cè)。
(3)實(shí)用性差,該方法缺乏一個(gè)支持單個(gè)和批量輸入,并能將預(yù)測(cè)結(jié)果分為三類(變異導(dǎo)致蛋白質(zhì)穩(wěn)定性升高、降低、不變)的系統(tǒng)。
發(fā)明內(nèi)容
為了解決上述問(wèn)題,本發(fā)明旨在提供一種預(yù)測(cè)氨基酸變異對(duì)蛋白質(zhì)結(jié)構(gòu)穩(wěn)定性影響的系統(tǒng)及其方法,該系統(tǒng)及其方法可以依據(jù)用戶提供的氨基酸變異和對(duì)應(yīng)的蛋白質(zhì)序列,準(zhǔn)確預(yù)測(cè)該氨基酸變異會(huì)導(dǎo)致所在蛋白質(zhì)的結(jié)構(gòu)穩(wěn)定性升高、降低或不變,以及相應(yīng)概率,并將結(jié)果存儲(chǔ)并發(fā)送用戶保存。
為實(shí)現(xiàn)上述技術(shù)目的,達(dá)到上述技術(shù)效果,本發(fā)明通過(guò)以下技術(shù)方案實(shí)現(xiàn):
一種預(yù)測(cè)氨基酸變異對(duì)蛋白質(zhì)結(jié)構(gòu)穩(wěn)定性影響的系統(tǒng),由氨基酸變異信息輸入模塊、氨基酸變異位點(diǎn)屬性計(jì)算模塊、蛋白質(zhì)序列屬性計(jì)算模塊、預(yù)測(cè)穩(wěn)定性變化模塊、預(yù)測(cè)結(jié)果輸出模塊組成,其中,所述氨基酸變異信息輸入模塊分別與所述氨基酸變異位點(diǎn)屬性計(jì)算模塊和所述蛋白質(zhì)序列屬性計(jì)算模塊連接,所述氨基酸變異位點(diǎn)屬性計(jì)算模塊和所述蛋白質(zhì)序列屬性計(jì)算模塊同時(shí)與所述預(yù)測(cè)穩(wěn)定性變化模塊連接,所述預(yù)測(cè)穩(wěn)定性變化模塊與所述預(yù)測(cè)結(jié)果輸出模塊連接;
所述氨基酸變異信息輸入模塊的功能為獲取用戶提交的單個(gè)或成組的氨基酸變異及其蛋白質(zhì)序列,并進(jìn)行用戶信息及數(shù)據(jù)的存儲(chǔ);
所述氨基酸變異位點(diǎn)屬性計(jì)算模塊的功能為根據(jù)野生型和變異型位點(diǎn)上的氨基酸情況,提取相對(duì)應(yīng)的AAindex屬性特征值,并根據(jù)氨基酸變異數(shù)據(jù),計(jì)算變異后的氨基酸位點(diǎn)物理化學(xué)屬性特征;
所述蛋白質(zhì)序列屬性計(jì)算模塊的功能為根據(jù)氨基酸變異數(shù)據(jù)計(jì)算相關(guān)蛋白質(zhì)的保守性以及蛋白質(zhì)屬性特征;
所述預(yù)測(cè)穩(wěn)定性變化模塊的功能為通過(guò)基于隨機(jī)森林的兩層三分類算法將氨基酸變異對(duì)蛋白質(zhì)穩(wěn)定性的影響進(jìn)行計(jì)算和分類,并給出相應(yīng)概率,作為預(yù)測(cè)結(jié)果;
所述預(yù)測(cè)結(jié)果輸出模塊的功能為將預(yù)測(cè)結(jié)果生成excel和pdf文件形式,存儲(chǔ)并自動(dòng)郵件發(fā)送用戶,同時(shí)支持用戶查詢統(tǒng)計(jì)。
一種預(yù)測(cè)氨基酸變異對(duì)蛋白質(zhì)結(jié)構(gòu)穩(wěn)定性影響的方法,包括以下步驟:
步驟1)所述氨基酸變異信息輸入模塊首先根據(jù)用戶輸入的氨基酸變異信息,獲取其中的氨基酸變異及其蛋白質(zhì)序列,然后所述氨基酸變異信息輸入模塊將獲取到的氨基酸變異數(shù)據(jù)以及與氨基酸變異對(duì)應(yīng)的蛋白質(zhì)序列數(shù)據(jù)分別傳輸至所述氨基酸變異位點(diǎn)屬性計(jì)算模塊和所述蛋白質(zhì)序列屬性計(jì)算模塊,同時(shí),所有輸入數(shù)據(jù)以及提交數(shù)據(jù)的用戶信息將被系統(tǒng)存儲(chǔ);
步驟2)在收到所述氨基酸變異數(shù)據(jù)后,所述氨基酸變異位點(diǎn)屬性計(jì)算模塊一方面從AAindex數(shù)據(jù)庫(kù)中,根據(jù)野生型和變異型位點(diǎn)上的氨基酸情況,提取相對(duì)應(yīng)的AAindex屬性特征值,另一方面以該氨基酸變異位點(diǎn)為中心,計(jì)算相鄰位點(diǎn)中各類氨基酸的分布情況,并換算成相應(yīng)的氨基酸位點(diǎn)物理化學(xué)屬性特征;然后,所述氨基酸變異位點(diǎn)屬性計(jì)算模塊將提取到的所述AAindex屬性特征值和計(jì)算出的所述氨基酸位點(diǎn)物理化學(xué)屬性特征同時(shí)傳輸至所述預(yù)測(cè)穩(wěn)定性變化模塊;
步驟3)在收到所述與氨基酸變異對(duì)應(yīng)的蛋白質(zhì)序列數(shù)據(jù)后,所述蛋白質(zhì)序列屬性計(jì)算模塊一方面調(diào)用BLAST方法尋找該蛋白質(zhì)序列的同源序列,然后構(gòu)造PSSM矩陣,計(jì)算該蛋白質(zhì)序列的保守性,作為預(yù)測(cè)的輸入屬性特征;另一方面調(diào)用ProtDCal算法,計(jì)算該蛋白質(zhì)序列的蛋白質(zhì)屬性特征;然后,所述蛋白質(zhì)序列屬性計(jì)算模塊將計(jì)算出的該蛋白質(zhì)序列的保守性和蛋白質(zhì)屬性同時(shí)傳輸至所述預(yù)測(cè)穩(wěn)定性變化模塊;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于蘇州大學(xué),未經(jīng)蘇州大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710533801.8/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F19-00 專門適用于特定應(yīng)用的數(shù)字計(jì)算或數(shù)據(jù)處理的設(shè)備或方法
G06F19-10 .生物信息學(xué),即計(jì)算分子生物學(xué)中的遺傳或蛋白質(zhì)相關(guān)的數(shù)據(jù)處理方法或系統(tǒng)
G06F19-12 ..用于系統(tǒng)生物學(xué)的建模或仿真,例如:概率模型或動(dòng)態(tài)模型,遺傳基因管理網(wǎng)絡(luò),蛋白質(zhì)交互作用網(wǎng)絡(luò)或新陳代謝作用網(wǎng)絡(luò)
G06F19-14 ..用于發(fā)展或進(jìn)化的,例如:進(jìn)化的保存區(qū)域決定或進(jìn)化樹結(jié)構(gòu)
G06F19-16 ..用于分子結(jié)構(gòu)的,例如:結(jié)構(gòu)排序,結(jié)構(gòu)或功能關(guān)系,蛋白質(zhì)折疊,結(jié)構(gòu)域拓?fù)洌媒Y(jié)構(gòu)數(shù)據(jù)的藥靶,涉及二維或三維結(jié)構(gòu)的
G06F19-18 ..用于功能性基因組學(xué)或蛋白質(zhì)組學(xué)的,例如:基因型–表型關(guān)聯(lián),不均衡連接,種群遺傳學(xué),結(jié)合位置鑒定,變異發(fā)生,基因型或染色體組的注釋,蛋白質(zhì)相互作用或蛋白質(zhì)核酸的相互作用
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法、程序以及記錄介質(zhì)
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 基于時(shí)間序列預(yù)測(cè)模型適用性量化的預(yù)測(cè)模型選擇方法
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 分類預(yù)測(cè)方法及裝置、預(yù)測(cè)模型訓(xùn)練方法及裝置
- 幀內(nèi)預(yù)測(cè)的方法及裝置
- 圖像預(yù)測(cè)方法及裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 文本預(yù)測(cè)方法、裝置以及電子設(shè)備
- 模型融合方法、預(yù)測(cè)方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種預(yù)測(cè)性變異測(cè)試方法
- 一種冗余變異體識(shí)別方法
- 基于Android多線程數(shù)據(jù)依賴的變異測(cè)試方法
- 序列變異校驗(yàn)方法和裝置、生產(chǎn)變異序列的方法和裝置及電子設(shè)備
- 對(duì)測(cè)序序列進(jìn)行變異模擬的方法及其應(yīng)用
- 一種冗余變異體識(shí)別方法及識(shí)別裝置
- 致病性變異位點(diǎn)判定方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 測(cè)試方法、裝置和計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種模型非依賴的基因組結(jié)構(gòu)變異檢測(cè)系統(tǒng)及方法
- 結(jié)構(gòu)變異檢測(cè)模型、其構(gòu)建方法和裝置





