[發明專利]水平轉移基因的預測有效
| 申請號: | 201210170762.7 | 申請日: | 2012-05-29 |
| 公開(公告)號: | CN103294934B | 公開(公告)日: | 2018-02-23 |
| 發明(設計)人: | 沙米拉·謝克哈·馬休;瓦倫·梅拉;塔里尼·山卡·果時 | 申請(專利權)人: | 塔塔咨詢服務有限公司 |
| 主分類號: | G06F19/18 | 分類號: | G06F19/18 |
| 代理公司: | 廣州粵高專利商標代理有限公司44102 | 代理人: | 倪小敏 |
| 地址: | 印度*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 水平 轉移 基因 預測 | ||
技術領域
本發明大體涉及基因組學領域,特別是涉及水平轉移基因的預測。
背景技術
基因組學在當今是非常活躍的研究領域。從生物體獲得的遺傳材料通常被測序以分成多個序列,這些序列被稱為基因組序列?;蚪M序列可被進一步分析以研究相應基因組的特性,例如用以識別基因和研究構成基因組序列的基因之間的相互作用。為獲得給定的生物體在其所處環境中運作和生存策略的整體觀察,不僅需要獨立研究每個單獨的基因組,而且需要了解基因組信息在其環境中的各種生物體基因組之間的交換的程度和模式。
在相同環境樣品中的各種生物體基因組的比較分析顯示,存在這樣的基因或基因簇,即這些基因或基因簇顯示出與已建立的生命系統發育樹不同的遺傳模式。與其系統發育近親相比,這些基因或基因簇顯示出與來自屬于不同分類進化枝的生物體的基因更高的序列同源性。
已觀察到,這些基因或基因簇在棲息于相同微環境(即個體鄰近)的生物體之間共享而不是在這些生物體的系統發育近親之間共享。這種相同微環境內的不同生物體的個體鄰近增加了遺傳材料在各種物種之間交換的機會。
交換基因組材料的過程被稱為水平基因轉移或側向基因轉移,其結果導致一個生物體包含了來自另一生物體的部分遺傳材料。這種基因轉移事件可使來自“供體”基因組的大面積外源DNA(脫氧核糖核酸)插入到天然“受體”基因組中,并且通常觀察到不同于天然受體基因組的寡核苷酸利用模式。這些交換的基因或基因簇被稱為水平轉移基因或HGT區。
水平轉移基因賦予了生物體在給定環境中生長和生存的選擇性優勢。例如,這些基因或基因簇可賦予各種不同的特性,例如對很多抗生素的耐藥性(例如多藥耐藥基因操縱子)、包含分泌系統(例如III型、IV型、VI型分泌系統)的毒性相關功能,以及提供對病原生物體的宿主免疫系統防衛機制的專門系統。這些也包括促進受體細胞向宿主細胞膜的趨化性和粘附的基因,甚至包括編碼增加受體生物體在營養缺陷型環境中生存機會的專門代謝酶的基因。
因此,在不同生物體的基因組中有效檢測出這些HGT區,對理解這些基因的可能的轉移機制和發現增強受體生物體在各種微環境中的生存的特定功能非常有用。
發明內容
本部分用來介紹與水平轉移基因的預測相關的理念,這些理念將在下文進一步詳細描述。本部分并非用來確定要求保護的發明主題的必要特征,也并非用來確定或限定所要求保護的主題的范圍。
本發明描述了預測水平轉移基因的方法和系統。多個基因組片段(通過分離多個完全測序的微生物體的基因組獲得)被轉換成三維空間內的片段點(fragment point)。在該三維空間內定義出一個立方體,使得該立方體包括對應于所有基因組片段的片段點。該立方體被進一步分成多個較小的等尺寸的立方體(被稱為網格(grid))。落入一個網格內的片段點被組合在一起并且計算出每個網格的質心。選擇出具有對應于一個特定基因組的片段點的一個或多個網格,并將每個選擇出的網格分類為相對該特定基因組是多數網格、少數網格和混合網格中的一個。而且,基于距離比評價,一個或多個基因組片段從少數網格和混合網格中被識別為水平轉移基因。
附圖說明
本發明將參考附圖詳細說明。在附圖中,附圖標記最左邊的數字代表該附圖標記首次出現時所在的圖號。在附圖中,相同附圖標記用來表示相似的特征和組成。
圖1(a)圖示出根據本發明的一個實施方式的用于水平轉移基因預測的示例性系統。
圖1(b)圖示出根據本發明的一個實施方式的網格構架,其顯示對應基因組片段的片段點的定位模式。
圖1(c)圖示出根據本發明的一個實施方式的圖表,其展示基于片段的閾值和數目將網格分類為多數網格、少數網格和混合網格。
圖1(d)圖示出根據本發明的一個實施方式的方法的圖示,該方法用于基于片段點的位置而關聯置信度。
圖2圖示出根據本發明的一個實施方式的用于預測水平轉移基因的示例性方法。
圖3圖示出根據本發明的一個實施方式的將基因組片段轉換成三維空間內的片段點的示例性方法。
圖4圖示出根據本發明的一個實施方式的在三維空間內定義具有網格和包括對應基因組片段的片段點的立方體的示例性方法。
圖5圖示出根據本發明的一個實施方式的用于將選擇出的網格分類為多數網格、少數網格和混合網格中的一種的示例性方法。
具體實施方式
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于塔塔咨詢服務有限公司,未經塔塔咨詢服務有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210170762.7/2.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06F 電數字數據處理
G06F19-00 專門適用于特定應用的數字計算或數據處理的設備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質相關的數據處理方法或系統
G06F19-12 ..用于系統生物學的建?;蚍抡妫纾焊怕誓P突騽討B模型,遺傳基因管理網絡,蛋白質交互作用網絡或新陳代謝作用網絡
G06F19-14 ..用于發展或進化的,例如:進化的保存區域決定或進化樹結構
G06F19-16 ..用于分子結構的,例如:結構排序,結構或功能關系,蛋白質折疊,結構域拓撲,用結構數據的藥靶,涉及二維或三維結構的
G06F19-18 ..用于功能性基因組學或蛋白質組學的,例如:基因型–表型關聯,不均衡連接,種群遺傳學,結合位置鑒定,變異發生,基因型或染色體組的注釋,蛋白質相互作用或蛋白質核酸的相互作用





