[發明專利]一種利用文本挖掘進行病毒及人類蛋白相互作用的方法無效
| 申請號: | 201010193130.3 | 申請日: | 2010-06-04 |
| 公開(公告)號: | CN102268485A | 公開(公告)日: | 2011-12-07 |
| 發明(設計)人: | 曾華宗 | 申請(專利權)人: | 上海聚類生物科技有限公司 |
| 主分類號: | C12Q1/70 | 分類號: | C12Q1/70;C12Q1/68;G01N33/53;G06F19/24 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 200333 上海市*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 利用 文本 挖掘 進行 病毒 人類 蛋白 相互作用 方法 | ||
技術領域
本發明屬于生物技術領域,涉及一種利用文獻挖掘技術進行病毒與人類蛋白相互作用研究的方法。
背景技術
病毒是一種非細胞生命形態,它由一個核酸長鏈和蛋白質外殼構成,病毒沒有自己的代謝機構,沒有酶系統。因此病毒離開了宿主細胞,就成了沒有任何生命活動、也不能獨立自我繁殖的化學物質。一旦進入宿主細胞后,它就可以利用細胞中的物質和能量以及復制、轉錄和轉譯的能力,按照它自己的核酸所包含的遺傳信息產生和它一樣的新一代病毒。
病毒的主要特征之一便是致瘤作用,有一些病毒能誘發良性腫瘤,如痘病毒科的兔纖維瘤病毒、人傳染性軟疣病毒和乳多泡病毒科的乳頭瘤病毒;另有一些能誘發惡性腫瘤,按其核酸種類可分為DNA腫瘤病毒和RNA腫瘤病毒。病毒在自身上表現代謝無活性,具感染性,對細胞有絕對的依存性,表現在:存在于細胞外的病毒不具遺傳活性,但保留感染活性;當病毒在宿主細胞內是,病毒便復制、翻譯、表達自身核酸,已侵染細胞。對于宿主細胞,病毒的侵入,往往會導致宿主細胞蛋白表達模式的改變,抑制宿主蛋白基因的表達,這種抑制將影響宿主細胞的正常生理功能并決定病毒的致病進程和結果。
最新研究表明,病毒對人類蛋白的抑制調控作用存在多種形式,本發明特提出一種假說:病毒通過自身基因表達蛋白,調控人類蛋白轉錄因子的表達,再經由特定表達的轉錄因子調控人類蛋白的表達,這是病毒調控蛋白的一種形式。
發明內容
本發明的方法主要研究的問題是病毒與人類蛋白相互作用的關系,基于一種文獻挖掘技術研究找出病毒對人類蛋白的調控機制。因此我們提出一種病毒調控蛋白的假說,其假說為:病毒不會直接調控人類目標蛋白,而是通過調控相關的轉錄因子來間接調控目標蛋白的表達。為此我們設計了如下流程:
1、利用文獻挖掘技術構建病毒與人類基因的相互作用數據庫
2、利用上述數據庫對病毒和人類蛋白進行相互作用關系分析,并從中提取出轉錄因子基因
3、對轉錄因子進行調控蛋白預測,預測出的調控蛋白即被認為跟病毒存在間接的相互作用。
4、對病毒與人類調控基因進行實驗驗證,驗證其表達調控關系
附圖說明
圖1是本發明方法的實施流程圖
圖2是使用文獻挖掘技術找出的HBV與人類蛋白基因的相互作用關系
圖3是采用western?blot實驗驗證HBV與人類蛋白基因IFNAR2表達調控關系的結果。
實施方式
本發明的方法將以HBV(乙型肝炎病毒)與人類蛋白的相互作用關系為例介紹本發明實施的具體方式。
步驟1、構建HBV與人類基因的相互作用數據庫,從PubMed文獻摘要數據庫中下載HBV與人類基因相互作用關系的相關文獻,構建數據庫。步驟為:
1)Document?searching?&?formating:文檔搜索及格式化,利用關鍵詞進行文檔搜索,并將文檔整理成XML格式。
2)Sentence?tokenlization?using?Lingpipe:利用Lingpipe工具包中的Sentencetokenlization工具將摘要文本分離成單個句子。后續的分析是以句子為基本單位的。
3)Human?gene?mention?tagging?using?ABNER:利用ABNER軟件進行人類基因的描述的定位。提取人類基因。
4)Conjunction?resolution:對于提取的基因的描述中,如“STAT3/5gene”將被解析成STAT3gene和STAT5gene
5)Gene?name?normalization?based?on?Entrez?database:由于自由文本中對于基因的名字比較混亂,需要將文章中的基因描述統一為官方基因符號,以方便分析和比較。基因符號以NCBI的entrez?gene數據庫為準。
6)Verb?tagging?using?Lingpipe?and?inhouse?protein-protein?interaction?verbdictionary:先建立一個蛋白互作的verb詞典,包含如repress,regulate,inhibit,interact,phosphorylate,downregulate,upregulate等所有動詞及其變型。詞典取材自BioNLP項目(http://bionlp.sourceforge.net/)。然后利用Lingpipe工具包分離句子中蛋白互作的verb。并以此構建文獻數據庫。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海聚類生物科技有限公司,未經上海聚類生物科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010193130.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:液體噴出裝置以及噴出檢查方法
- 下一篇:懸滴板





