[發明專利]基于在線機器學習的Hi-C接觸矩陣中層級式TADs差異分析方法有效
| 申請號: | 201910315741.1 | 申請日: | 2019-04-19 |
| 公開(公告)號: | CN110097922B | 公開(公告)日: | 2020-12-08 |
| 發明(設計)人: | 呂紅強;劉聰毅;韓九強 | 申請(專利權)人: | 西安交通大學 |
| 主分類號: | G16B20/00 | 分類號: | G16B20/00;G16B25/00;G16B40/00;G16B45/00;G06F17/15;G06F17/16;G06N20/00 |
| 代理公司: | 西安智大知識產權代理事務所 61215 | 代理人: | 段俊濤 |
| 地址: | 710049 陜*** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 在線 機器 學習 hi 接觸 矩陣 層級 tads 差異 分析 方法 | ||
1.一種基于在線機器學習的Hi-C接觸矩陣中層級式TADs差異分析方法,其特征在于,包括如下步驟:
步驟1、對Hi-C數據進行標準化處理以消除Hi-C實驗的系統偏差并且增強數據之間的可比性;
步驟2、對經過標準化之后的Hi-C數據計算每個bin上游和下游區域之間的交互頻數的平均值,記為binSignal(i);
步驟3、利用曲線擬合算法對序列binSignal(i)進行擬合,將擬合曲線的局部最小點初步視為TADs的邊界區域點;
步驟4、通過秩和檢驗的方法,對假陽性的TADs邊界區域點進行濾除,獲得最終的TADs的邊界區域點;
步驟5、根據TADs的邊界區域點得到所有可能的層級式TADs,建立Hi-C接觸矩陣M中交互頻數Mij和所有可能層級式TADs之間的數學模型;
步驟6、確立模型的目標函數,利用在線機器學習算法FTRL對目標函數進行求解;
步驟7、基于求解的結果,識別出不同細胞系具有差異性的層級式TADs。
2.根據權利要求1所述基于在線機器學習的Hi-C接觸矩陣中層級式TADs差異分析方法,其特征在于,步驟1中所述對Hi-C數據進行標準化處理的具體方法為:
首先采用跨細胞系的Hi-C數據標準化方法multiHiCcompare對不同細胞系下的Hi-C數據進行初步處理,以盡可能地消除不同細胞系之間的系統偏差;然后利用數據標準化方法CPM(Counts per million)對經過初步處理的Hi-C數據進行處理,以進一步增強不同細胞系之間Hi-C數據的可比性。
3.根據權利要求1所述基于在線機器學習的Hi-C接觸矩陣中層級式TADs差異分析方法,其特征在于,步驟2中所述計算binSignal(i)的具體方法為:
對于下標索引為i的bin,其上下游區域之間的平均交互頻數記為binSignal(i),上下游區域的窗口大小為w,binSignal(i)根據以下公式進行計算:
其中Ui(l)表示下標索引為i的bin的上游區域中的某個bin,Di(m)表示下標索引為i的bin的下游區域中的某個bin,cont.freq表示上、下游區域bin之間的交互頻數,l表示上游區域窗口元素的索引,m表示下游區域窗口元素的索引。
4.根據權利要求1所述基于在線機器學習的Hi-C接觸矩陣中層級式TADs差異分析方法,其特征在于,步驟4中所述利用秩和檢驗濾除假陽性TADs邊界區域點的具體方法為:
通過統計需要檢驗的TADs邊界區域一定范圍內上下游之間的交互頻數S1和上游之間或者下游之間的交互頻數S2,采用秩和檢驗的方法檢驗S1和S2之間是否有明顯的差異性,如果有明顯的差異性,就認為該TADs邊界區域是假陽性,需要被濾除,否則認為該TADs邊界區域是真陽性,所述有明顯的差異性指的是秩和檢驗的概率小于0.05。
5.根據權利要求1所述基于在線機器學習的Hi-C接觸矩陣中層級式TADs差異分析方法,其特征在于,步驟5中所述接觸矩陣M是一個對稱的方陣,接觸矩陣中每個元素稱為交互頻數,交互頻數Mij和所有可能層級式TADs的數學模型為:
Y=XB+N(0,σ2),其中,B≥0
其中,Y表示所有Hi-C接觸矩陣的交互頻數組成的矩陣,Y中每一列元素為一個接觸矩陣含對角線在內的下三角區域交互頻數構成的向量,X表示交互頻數和所有可能層級式TADs的位置關系,B表示所有可能層級式TADs的權重系數,N(0,σ2)表示由正態分布產生的噪聲,σ表示正態分布的標準差。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西安交通大學,未經西安交通大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910315741.1/1.html,轉載請聲明來源鉆瓜專利網。





