[發(fā)明專利]應用于組織樣本中染色體上轉(zhuǎn)錄因子結(jié)合位點的檢測方法在審
| 申請?zhí)枺?/td> | 201711464358.X | 申請日: | 2017-12-28 |
| 公開(公告)號: | CN108052797A | 公開(公告)日: | 2018-05-18 |
| 發(fā)明(設(shè)計)人: | 李旦 | 申請(專利權(quán))人: | 上海嘉因生物科技有限公司 |
| 主分類號: | G06F19/20 | 分類號: | G06F19/20 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 200000 上海市楊*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 應用于 組織 樣本 染色體 轉(zhuǎn)錄 因子 結(jié)合 檢測 方法 | ||
1.應用于組織樣本中染色體上轉(zhuǎn)錄因子結(jié)合位點的檢測方法,其特征在于,包括以下步驟:
步驟一:數(shù)據(jù)預處理:
首先,讀取樣本的ChIP-seq數(shù)據(jù),并將其比對到參考基因組上,尋找出轉(zhuǎn)錄因子結(jié)合位點富集的特征峰和峰頂點的位置信息;然后,以所述峰頂點為中心分別向左右兩側(cè)延展500bp,延伸后的數(shù)據(jù)中,每一個DNA序列的中心均為所述峰頂點;最后,將所述DNA序列提取出來并去掉其中重復的序列得到DNA短序列;
步驟二:分割DNA短序列:
將所述DNA短序列中前N-4個堿基分別依次作為頭堿基,將所述頭堿基及其之后連續(xù)的四個堿基劃分為一個子序列,并將所述頭堿基在所述DNA短序列的次序作為所述子序列的編號,所述子序列的編號為正整數(shù);所述N是所述DNA短序列中的堿基數(shù)量,所述N為正整數(shù);所述子序列中包括五個堿基,所述頭堿基是所述子序列中的第一個堿基,所述DNA短序列可以劃分出N-4個所述子序列;
步驟三:均值檢測:
分別對四種堿基計算當前堿基均值,所述四種堿基包括A(腺嘌呤)、T(胸腺嘧啶)、C(胞嘧啶)、G(鳥嘌呤):
(1)正在計算的堿基為當前堿基,按照所述子序列的編號,依次統(tǒng)計當前堿基在所述子序列中出現(xiàn)的次數(shù)得到均值向量(y
(2)統(tǒng)計出所述均值向量中取值大于3的元素的個數(shù)即為當前堿基均值;
對所述四種堿基計算出的所述當前堿基均值進行均值檢測:如果四個所述當前堿基均值都在0.8N~1.2N的范圍內(nèi),則進行步驟四;否則檢測結(jié)束,所述DNA短序列不是轉(zhuǎn)錄因子結(jié)合位點;
步驟四:概率檢測:
分別對四種所述堿基計算當前堿基概率,用公式一計算:
公式一:
其中,G是所述當前堿基概率,為0~1之間的實數(shù),沒有單位;σ、μ是方差因子和均值因子,為0~5之間的實數(shù),由檢測人員根據(jù)經(jīng)驗值確定;i是所述子序列的編號,y
對所述四種堿基計算出的所述當前堿基概率進行概率檢測:如果四個所述當前堿基概率取值均小于0.7,則所述DNA短序列不是所述轉(zhuǎn)錄因子結(jié)合位點;否則,所述DNA短序列是所述轉(zhuǎn)錄因子結(jié)合位點。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海嘉因生物科技有限公司,未經(jīng)上海嘉因生物科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711464358.X/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字數(shù)據(jù)處理
G06F19-00 專門適用于特定應用的數(shù)字計算或數(shù)據(jù)處理的設(shè)備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質(zhì)相關(guān)的數(shù)據(jù)處理方法或系統(tǒng)
G06F19-12 ..用于系統(tǒng)生物學的建模或仿真,例如:概率模型或動態(tài)模型,遺傳基因管理網(wǎng)絡(luò),蛋白質(zhì)交互作用網(wǎng)絡(luò)或新陳代謝作用網(wǎng)絡(luò)
G06F19-14 ..用于發(fā)展或進化的,例如:進化的保存區(qū)域決定或進化樹結(jié)構(gòu)
G06F19-16 ..用于分子結(jié)構(gòu)的,例如:結(jié)構(gòu)排序,結(jié)構(gòu)或功能關(guān)系,蛋白質(zhì)折疊,結(jié)構(gòu)域拓撲,用結(jié)構(gòu)數(shù)據(jù)的藥靶,涉及二維或三維結(jié)構(gòu)的
G06F19-18 ..用于功能性基因組學或蛋白質(zhì)組學的,例如:基因型–表型關(guān)聯(lián),不均衡連接,種群遺傳學,結(jié)合位置鑒定,變異發(fā)生,基因型或染色體組的注釋,蛋白質(zhì)相互作用或蛋白質(zhì)核酸的相互作用





