日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]基于反饋式條件隨機場的G蛋白偶聯受體拓撲計算預測方法有效

專利信息
申請號: 201510155276.1 申請日: 2015-04-02
公開(公告)號: CN104732117B 公開(公告)日: 2018-02-13
發明(設計)人: 陳石敏;吳宏杰;陸衛忠;王坤;胡伏原;付保川 申請(專利權)人: 蘇州科技學院
主分類號: G06F19/18 分類號: G06F19/18
代理公司: 蘇州慧通知識產權代理事務所(普通合伙)32239 代理人: 安紀平
地址: 215009 *** 國省代碼: 江蘇;32
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 基于 反饋 條件 隨機 蛋白 受體 拓撲 計算 預測 方法
【說明書】:

技術領域

發明屬于G蛋白偶聯受體預測領域,具體涉及一種基于反饋式條件隨機場的G蛋白歐聯受體拓撲計算預測方法。

背景技術

G蛋白偶聯受體(G Protein-Coupled Receptor,GPCR)是一類具有7個跨膜螺旋的受體蛋白質,其跨膜區域拓撲示意如圖1所示。GPCR因能結合和調節G蛋白活性而得名,GPCR負責細胞與外部環境之間的信息傳輸,是一類非常重要的信號分子受體,對生物與藥物研究有著重要的作用。但由于經典的X射線衍射方法與核磁共振(NMR)實驗方法對GPCR都失效了,到2015年3月,實驗僅確定了24個GPCR及配體的高精度三維結構。由此,急需發展快速有效的計算機模擬方法來探索GPCR的結構。其中,關于確定GPCR拓撲的研究成為了開啟GPCR結構與功能關系的鑰匙,已成為當前該領域的熱點。

GPCR結構拓撲預測是指以GPCR氨基酸序列作為輸入,輸出各氨基酸的結構拓撲狀態標簽。典型的結構拓撲狀態有:哪些區域是跨膜螺旋,哪些區域是卷曲;區分哪些是膜內螺旋,哪些是膜外螺旋。Sikander Hayat與Arne Elofsson開發了一種名稱為BOCTOPUS的拓撲預測方法,BOCTOPUS的結構由兩層組成(圖2),第一層包括三個支持向量機來預測本地偏好的殘基是在一個特定的位置;第二層由該預測的拓撲的HMM模型。數據集被分成10組,使得屬于同一超家族蛋白是在同一組;在訓練期間,9組用于測試的第10組的性能。三個支持向量機,如圖2中的A部分,用LIBSVM實現,以確定每個殘基的偏好是在“I”,“O”或“M”的區域。嘗試了徑向基和線性內核,不同的窗口尺寸在1-31的范圍內進行嘗試。最優窗口大小基于所述最高相關馬氏系數(MCC)來確定。從三個支持向量機產生的概率產生“IOM數據”被用作輸入用于訓練的HMM參數的不同組合。在BOCTOPUS使用的HMM,結構示于圖2中的B部分,描述了全局拓撲的HMM包括一個預測階段的描述第一跨膜之前該區域β鏈被檢測。另外,TMB由四個不同的狀態分別代表內環,外環和向上和向下鏈中所定義。

生物信息中常用的有監督與無監督學習方法,如:隱馬爾可夫模型、神經網絡、支持向量機、動態貝葉都曾被使用于拓撲的預測。這些方法雖然預測結果都取得了一定的效果,但很難有進一步的提高。

現有的這些方法主要存在兩個問題:第一,現有學習方法難以建模蛋白質序列的全局相關性特點。隱馬爾可夫模型作為一種產生式模型,是基于觀察序列和狀態序列的聯合概率密度的,隱馬爾可夫模型的獨立性假設使其不能考慮上下文的特征,這就限制了特征的選擇。同時,GPCR序列的多樣性和相關性也使得基于隱馬爾可夫模型的方法難以對遠距離殘基的關系進行建模。最大熵模型解決了隱馬爾可夫模型中的特征值選取的問題,但同時也帶來了標記偏見的問題—凡是訓練集中未出現的情況都被忽略掉。條件隨機場(CRF)則不存在上述問題,和隱馬爾可夫模型不同,條件隨機場是一種概率圖模型,不需要對觀察序列進行獨立性假設,也就克服了隱馬爾可夫模型局部最優的問題。條件隨機場已經被成功的應用于自然語言處理和生物信息處理等領域。

第二,現有模型難以進行自我改善,缺乏一個有效的反饋機制。在特征數量一定的情況下,通過反饋機制可以把結果作為特征,增加了條件隨機場的可用知識。高層模型及時獲取低層模型的結果,可以根據新的結果特征構建模型,及時糾正過高或過低估計的問題,從而提高預測精度。

發明內容

為解決上述技術問題,本發明提供了一種反饋式基本條件隨機場模型(FCRF)用于對GPCR的拓撲結構進行預測。基于條件隨機場的聯合概率模型,不需要對觀察序列進行獨立性假設,從而解決隱馬爾可夫模型的局部最優問題;其次,本發明改進了基本條件隨機場方法,引入了反饋機制,在不斷的反饋中自我完善條件隨機場的建模能力,從而最終提高GPCR拓撲的預測精度。

為達到上述目的,本發明的技術方案如下:

一種基于反饋式條件隨機場的G蛋白偶聯受體拓撲計算預測方法,該預測方法包括:

(1)數據集準備:準備TMPDB_FB和PDBTM_FB兩個數據集,所述TMPDB_FB包含從TMPDB中選取的106條不同的α螺旋鏈,所述PDBTM_FB包含從PDBTM中選取的472條非冗余的α螺旋鏈;

(2)數據預處理:對所述數據集進行歸一化,把殘基的物理屬性值和輪廓特征屬性值的值域映射到[0,1]區間;

(3)反饋式條件隨機場,包括三個階段:

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘇州科技學院,未經蘇州科技學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201510155276.1/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 91免费国产视频| 99爱精品在线| 日本一区二区三区电影免费观看| 欧美久久一区二区三区| 日本福利一区二区| 亚洲欧美国产精品一区二区| 亚洲欧洲一区| 日韩亚洲欧美一区| 国产特级淫片免费看| 亲子乱子伦xxxx| 日本中文字幕一区| 国产精品1234区| 久久精品爱爱视频| 日本一二三不卡| 日韩一级在线视频| 亚欧精品在线观看| 99久久精品一区字幕狠狠婷婷| 国产精品你懂的在线| 久久九精品| 一区二区久久精品| 亚洲乱强伦| 国偷自产一区二区三区在线观看| 亚洲国产欧美一区二区三区丁香婷| 99色精品视频| xxxx国产一二三区xxxx| 精品无码久久久久国产| 国产精品你懂的在线| 国产在线干| 午夜生活理论片| 欧美精品免费看| 国产一区二区电影| 综合在线一区| 欧美精品在线一区二区| 色综合久久网| 精品国产免费久久| 日本一区二区在线观看视频| 99久久精品免费视频| 日韩午夜电影院| 欧美一级久久精品| 香蕉av一区| 国产不卡网站| 99精品在免费线偷拍| 国内自拍偷拍一区| 久久精品国产亚洲7777| 欧美精品中文字幕亚洲专区| 狠狠色狠狠色综合系列| 免费看性生活片| 欧美一区二区在线不卡 | 久久二区视频| 日本福利一区二区| 国产日韩欧美综合在线| 国产二区不卡| 免费的午夜毛片| 91麻豆精品国产91久久久更新资源速度超快 | 国产日韩欧美第一页| 欧美高清xxxxx| 亚洲精品中文字幕乱码三区91| 97久久国产亚洲精品超碰热| 在线观看欧美日韩国产| 91影视一区二区三区| 欧美日韩国产色综合一二三四| 99精品国产99久久久久久97| 国产91免费在线| 午夜黄色大片| 7799国产精品久久99| 免费超级乱淫视频播放| 久久久久国产亚洲| 午夜片在线| 久久不卡精品| 国产亚洲精品久久久久秋霞| 大bbw大bbw超大bbw| 狠狠色综合久久婷婷色天使| 国产麻豆一区二区三区精品| 夜夜精品视频一区二区| 日本精品一区视频| sb少妇高潮二区久久久久| 亚洲精品久久久久久久久久久久久久| 久久夜色精品久久噜噜亚| 国产黄一区二区毛片免下载 | 国产精品久久久综合久尹人久久9| 欧美日韩国产欧美| 少妇精品久久久久www蜜月|