日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]基于文本關系相似性的蛋白質交互關系識別方法有效

專利信息
申請號: 201510020404.1 申請日: 2015-01-15
公開(公告)號: CN104537280B 公開(公告)日: 2017-05-31
發明(設計)人: 牛耘;王宇偉;吳紅梅;魏歐 申請(專利權)人: 南京航空航天大學
主分類號: G06F19/24 分類號: G06F19/24
代理公司: 南京鐘山專利代理有限公司32252 代理人: 戴朝榮
地址: 210016 江*** 國省代碼: 江蘇;32
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 基于 文本 關系 相似性 蛋白質 交互 識別 方法
【說明書】:

技術領域

發明涉及生物醫學文獻中蛋白質交互關系的自動識別方法,具體來說涉及一種基于文本關系相似性的蛋白質交互關系識別方法。

背景技術

蛋白質是生物細胞最重要的成分。蛋白質作為生命活動的體現者并非孤立存在,它們通過彼此間的作用完成細胞中的大部分過程。蛋白質之間的交互信息Protein-Protein Interaction,PPI對于理解單個蛋白質的功能作用以及整個生物過程是至關重要的,是生物學研究的重要內容,也是解決大量醫學難題的關鍵信息。因而描述蛋白質之間交互關系Protein-Protein Interactions,PPI的網絡的建立一直是研究生物過程關注的核心問題,對于生物學研究具有重要意義。因此生物領域專家手工地從醫學文獻中提取了眾多的PPI并錄入到統一格式的數據庫中,如BIND,DIP,HPRD,IntAct和MINT等等。然而大量的蛋白質交互信息仍散布在以非格式化文本形式存儲的科技文獻中,并且文獻的數目在急劇地增長。依靠手工搜尋提取這些蛋白質交互信息的方式顯然不能滿足實際需要。因而如何從文獻中自動挖掘出蛋白質交互信息成為重要的課題要并且吸引了大量的研究。研究的主要任務是根據生物醫學文獻中的線索識別存在交互關系的蛋白質對。識別出的交互關系將用于PPI網絡的建立。

從文獻中自動挖掘蛋白質交互信息的方法涵蓋了簡單的同現分析到更為復雜的自然語言處理系統,大體可以分為以下三類。

第一類根據蛋白質的同現co-occurrence情況制定策略進行分析。基于同現的方法根據蛋白質在文本中出現位置的相近信息,通過計算兩個蛋白質的共現次數來推斷它們之間的交互作用。這種方法基于這樣的假設:如果兩個蛋白質實體經常出現在同一個句子或摘要中,它們則存在某種關系。就是蛋白質實體出現的位置越近、越經常在一起出現則越可能相關,基于這樣的假設可通過統計同現頻率計算出蛋白質實體存在關系的可能性。

基于共現的PPI識別方法的主要不足是由于蛋白質的同現關系并不一定對應交互關系,這種方法只能抽取已出現的PPI,而不能發現新出現的或較少出現的PPI。而且這種方法沒有充分分析包含目標蛋白質對的上下文對非交互關系進行過濾,這樣所得結果中會有大量的誤報,因而這種方法的識別的精度通常不高。

第二類方法通過建立能夠刻畫蛋白質交互關系的模式,將其作為規則來尋找蛋白質交互信息。模式匹配法是PPI關系抽取研究的一種主要方法。首先根據蛋白質交互在句子中的常用描述方式建立一組模式。一個模式或規則通常由單詞和詞性的序列組成,其中標出了形成交互關系的兩個蛋白質的位置。抽取PPI時,通過文本匹配尋找對應的交互信息,如果一個模式與一個句子相匹配,則提取出句中相應位置的蛋白質作為存在交互關系的蛋白質對。

Madkour等提出一個BioNoculars系統基于圖互增理論使用冗余數據構建領域無關的模板來抽取蛋白質交互關系。這種方法需要手工編寫規則,需大量的人力和時間。基于模式匹配的方法有助于提高PPI識別的精確度,然而由于模式集規模的限制導致基于規則或模式的方法明顯地降低了召回率。為了減輕手工制定模式的負擔,一些系統設計了自動模式獲取的算法。比如。Huang等人提出了一種從語料中自動獲取模式的方法和一種基于動態規劃的匹配算法,該方法將句子對齊,然后把句子中相似的部分提取出來作為抽取蛋白質交互關系的規則。自動建立的模式盡管能夠增加模式的數量,然而生成模式的質量仍無法滿足高精度交互關系識別的要求。

基于模式匹配的方法存在很大的局限性,其性能依賴于模式的數量和質量而且它無法抽取跨句子的實體關系。由于文本中蛋白質交互關系描述語言的多樣性和句法結構的復雜性,簡單的句法模式難以處理復雜的句子。同時人工建立簡單的模式因其有限的覆蓋面導致較低的召回率,而構造復雜模式的過程則又需要花費大量時間。另外,基于模式匹配的方法在未知關鍵詞的情況下不能生成新的模式規則,從而限制了蛋白質關系抽取的可拓展性,一旦規則集的大小達到了一定的規模,便很難將新規則加入現有的規則集。而且當關系抽取系統被應用到新領域的時候,基于規則的方法可能需要預先定義重新制定整個模式規則集以適應新的領域,從而降低了系統的可移植性。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京航空航天大學,未經南京航空航天大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201510020404.1/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 欧美午夜理伦三级在线观看偷窥| 妖精视频一区二区三区| 在线亚洲精品| 国久久久久久| 欧美精品日韩| 狠狠色综合久久丁香婷婷 | 欧美一级久久精品| 久久综合激情网| 日本伦精品一区二区三区免费| 99久久久国产精品免费无卡顿| 91精品国产91热久久久做人人| 激情久久综合| 国产精品黑色丝袜的老师| 91社区国产高清| 久久精品入口九色| 国产一区二区影院| 国产精品久久久久久久龚玥菲| 99精品久久久久久久婷婷| 欧美日本91精品久久久久| 日本三级香港三级| 亚洲午夜国产一区99re久久| 高清欧美精品xxxxx| 亚洲精品国产综合| 四季av中文字幕一区| 亚洲欧美日韩在线看| 国精产品一二四区在线看| 久久精品国产久精国产| 欧美一级久久久| 日韩亚洲精品视频| 欧美精品第1页| 欧美日韩乱码| 午夜电影网一区| 国产一区二区激情| 精品久久久影院| 国产伦精品一区二区三区照片91| 久久久午夜爽爽一区二区三区三州| 国产黄一区二区毛片免下载| 99久久精品一区字幕狠狠婷婷| 国产欧美日韩综合精品一| 国产一区二区在| 国产91电影在线观看| 久久影视一区二区| 一区二区三区欧美日韩| 991本久久精品久久久久| 国产乱人伦偷精品视频免下载| 国产视频一区二区视频| free性欧美hd另类丰满| 日韩精品一区中文字幕| 日韩欧美中文字幕一区| 亚洲在线久久| 国产欧美日韩va另类在线播放 | 91午夜在线观看| 国产1区2| 91麻豆精品国产91久久| 国产黄色网址大全| 久久99国产精品视频| 国产精品19乱码一区二区三区| 色婷婷久久一区二区三区麻豆| 91精品视频在线观看免费| 亚洲欧美日韩一级| 99er热精品视频国产| 国产日韩一二三区| 伊人av综合网| 日韩午夜电影在线| 午夜电影一区| 日本一级中文字幕久久久久久| 99re6国产露脸精品视频网站| 日韩av在线影视| 午夜av免费看| 少妇高潮大叫喷水| 精品国产九九| 午夜伦理在线观看| 日韩精品中文字幕在线| 午夜老司机电影| 久久99精品一区二区三区| 欧美精品日韩精品| 国产欧美二区| 亚洲精品久久久中文| 亚洲第一天堂久久| 99久久精品一区二区| 激情久久久久久| 国产精品99在线播放|