[發明專利]增強子在全基因組相互作用研究方法有效
| 申請號: | 201310584990.3 | 申請日: | 2013-11-14 |
| 公開(公告)號: | CN103646192B | 公開(公告)日: | 2017-06-09 |
| 發明(設計)人: | 馬永超;卑占宇;徐松濤;羅曉冰;常陸林;范文娟;吳華 | 申請(專利權)人: | 漯河醫學高等專科學校 |
| 主分類號: | G06F19/18 | 分類號: | G06F19/18 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 462000 河南省漯河*** | 國省代碼: | 河南;41 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 增強 基因組 相互作用 研究 方法 | ||
技術領域
本發明涉及一種增強子在全基因組相互作用研究方法,屬于基因技術領域。
背景技術
隨著人類基因組計劃的結束,分子生物學家研究開始轉向功能基因組,并已經開始著手尋找基因組功能片段。很多功能元件例如增強子(enhancers)、位點控制區域(LCRs),在染色質座位上遠離其靶基因,這為我們發現和鑒定帶來了困難。最近有研究表明,染色質可以通過相互作用對轉錄進行反式調控。研究細胞核內三維空間中功能元件的相互作用可以幫助我們了解基因組的功能調控機制。
增強子是一類短的DNA序列,其通過轉錄因子的介導能增強基因的表達水平。增強子一類典型的遠距離調控元件,它可以位于基因的遠端,甚至位于不同的染色體。增強子一般是通過比較基因組技術和增強子捕獲技術(enhancer trap techniques)鑒定。
研究染色質相互作用的主流技術都是基于染色體捕獲技術(chromatin conformation capture,3C)而建立的,從2002年最初的染色體捕獲技術到現在的Hi-c,歷經10余年的研究,科學家已經累積了很多染色質相互作用的數據。由于Hi-c能無偏差全基因組范圍捕獲染色質與染色質相互作用,且通量巨大。本發明選取人的兩個細胞系Hi-c數據,來分析增強子在全基因組范圍相互作用。
發明內容
本發明的目的在于提供一種增強子在全基因組相互作用研究方法,以便更加全面地研究增強子在基因中的作用,更好地了解基因組的功能調控機制。
為了實現上述目的,本發明的技術方案如下。
一種增強子在全基因組相互作用研究方法,具體包括以下步驟:
(1)數據轉換:
由于增強子數據庫的基因組位置是hg19而Hi-c的數據是hg18,采用UCSC網站liftover軟件把增強子數據轉換成hg18。對1760個增強子長度和分布進行統計分析得到統計分布圖,從中發現,增強子的長度大多小于2kbp,在各染色體上的分布不均勻。
(2)數據過慮:
過慮掉兩個染色質片段距離小于100kb的數據,得到hESC細胞系、IMR90細胞系以及它們的重復實驗基因表達數據,求兩個數據的平均值作為基因表達的量。根據基因或者轉錄本的表達量,把基因分為:低表達(表達值<50)、中表達(50<表達值<=500)、高表達(表達值>500),針對每類基因數量進行統計。
(3)數據注釋:
將過慮好的數據比對到增強子數據中,統計不同細胞實驗能捕獲到的增強子數,發現,測序讀序(read)數越多能捕獲到的增強子也越多,但是當測序讀序數達到一定數量時,增加大量的測序讀序似乎對于捕獲增強子的作用不顯著。
(4)結果分析:
比較4組增強子在全基因組范圍相互位點數據,在較大片段范圍內(1Mbp),四個實驗組數據重合度比較高,在更精細的范圍內(1kb),4個實驗組數據有著較大的區別,但是同一細胞系的重復試驗差別小于不同細胞系。這表明用Hi-c捕獲細胞系的染色質相互作用時,捕獲到的是細胞系的一個平均的相互作用,一個細胞系存在著大量的細胞,很難保證每個細胞處于同樣狀態,由于基因表達的時空差異,染色質的在核內的三維空間也是一種動態的過程。目前的技術限制很難做到單細胞的染色質構象捕獲。
將與增強子作用的位點進行注釋,得到相應數據,與增強子作用次數最多的是基因(Genes,大約占0.39%),其次是重復序列序列(大約占0.20%),再次是基因上游20K的位置(Up20k,約占17%),再次是基因組其他序列(NO,約占13%),再次是基因下游的20K(Down20k,約占9%),最少的增強子(Enhancer,約占0.2%)。
每個增強子平均能捕獲到幾十個作用片段,說明增強子在起作用時候,增強子和其他序列形成了一個以基因為中心比較復雜的三維結構。在增強子相互作用的片段中,基因與增強子相互租用頻率最高,這表明不管基因表達狀況如何,和基因在三維空間上的距離都是靠近的。重復序列是一個高頻率的相互作用類型,這表明有的重復序參與基因表達,有的增強子可能在維持染色質的三維結構上起著重要的作用。在4個實驗中,重復序列L1和增強子相互作用頻率是最高的,L1是一個富含AT的重復序列,包含了RNA聚合酶III的內部啟動子。另外在基因上游20K區域也是個高頻區,大多數的基因的啟動子都位于這個區域,很多增強子都是直接與啟動子相互作用,從而調節基因的表達。另外增強子與增強子也存在著相互作用,這可能提示基因需要多個增強子作用,以增強某個時刻的高表達。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于漯河醫學高等專科學校,未經漯河醫學高等專科學校許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310584990.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:形成嵌入式存儲器件的方法
- 下一篇:一種實現數據傳輸的方法、裝置和服務器
- 同類專利
- 專利分類
G06F 電數字數據處理
G06F19-00 專門適用于特定應用的數字計算或數據處理的設備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質相關的數據處理方法或系統
G06F19-12 ..用于系統生物學的建模或仿真,例如:概率模型或動態模型,遺傳基因管理網絡,蛋白質交互作用網絡或新陳代謝作用網絡
G06F19-14 ..用于發展或進化的,例如:進化的保存區域決定或進化樹結構
G06F19-16 ..用于分子結構的,例如:結構排序,結構或功能關系,蛋白質折疊,結構域拓撲,用結構數據的藥靶,涉及二維或三維結構的
G06F19-18 ..用于功能性基因組學或蛋白質組學的,例如:基因型–表型關聯,不均衡連接,種群遺傳學,結合位置鑒定,變異發生,基因型或染色體組的注釋,蛋白質相互作用或蛋白質核酸的相互作用





