[發明專利]一種基于概率圖的基因調控網絡分析方法在審
| 申請號: | 202110048797.2 | 申請日: | 2021-01-14 |
| 公開(公告)號: | CN112802543A | 公開(公告)日: | 2021-05-14 |
| 發明(設計)人: | 王之瓊;隋玲;曲璐渲;信俊昌;王煒祎祺;李嬋;殷文強 | 申請(專利權)人: | 東北大學 |
| 主分類號: | G16B5/00 | 分類號: | G16B5/00;G16B45/00 |
| 代理公司: | 沈陽東大知識產權代理有限公司 21109 | 代理人: | 梁焱 |
| 地址: | 110819 遼寧*** | 國省代碼: | 遼寧;21 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 概率 基因 調控 網絡分析 方法 | ||
1.一種基于概率圖的基因調控網絡分析方法,其特征在于:包括以下步驟:
步驟1:輸入概率圖并利用該概率圖表示基因調控網絡;
概率圖的每一個頂點代表一個基因,頂點間的有向邊代表基因間存在的調控關系,邊上的概率值表示基因間調控關系的強度;
步驟2:在表示基因調控網絡的概率圖上計算各頂點的中心性,包括度中心性、緊密中心性和中介中心性;
步驟3:根據概率圖上各頂點的中心性,篩選出關鍵節點;
步驟4:輸入源頂點集合S和目的頂點t,計算屬于源頂點集合S的各源頂點s到目的頂點t且經過關鍵節點的可達概率,并根據可達概率對各源頂點s進行排序。
2.根據權利要求1所述的基于概率圖的基因調控網絡分析方法,其特征在于:所述步驟2包括如下步驟:
步驟2.1:對概率圖進行采樣,得到多個基于概率圖的可能世界;
步驟2.2:在得到的各可能世界上計算各頂點的度中心性、緊密中心性與中介中心性;
步驟2.3:根據各頂點在各可能世界上的緊密中心性與中介中心性,分別在各可能世界上對所有頂點的緊密中心性和中介中心性進行排序;
步驟2.4:計算各頂點在所有可能世界上的度中心性的平均值、緊密中心性的排序次序的平均值和中介中心性的排序次序的平均值;
步驟2.5:取各頂點在所有可能世界上的度中心性的平均值、緊密中心性的排序次序的平均值和中介中心性的排序次序的平均值,分別作為概率圖上對應頂點的度中心性、緊密中心性和中介中心性。
3.根據權利要求2所述的基于概率圖的基因調控網絡分析方法,其特征在于:在步驟2.1中所述采樣的方法為:通過線性同余發生器生成隨機數,用確定性算法對概率圖上的每條邊生成[0,1]之間的隨機數后,判斷當前邊的存在概率是否大于該隨機數,若大于則保留該條邊,否則刪除該條邊;當所有邊都生成隨機數并判斷是否保留后,視為完成一次采樣,得到一個可能世界。
4.根據權利要求2所述的基于概率圖的基因調控網絡分析方法,其特征在于:在步驟2.2中,所述中介中心性的計算方法包括:首先判斷待計算中心性的頂點u的出度是否為零:若是,則頂點u的中介中心性為零;若否,則將概率圖的邊進行方向反轉,在反轉后的概率圖上計算與頂點u可達的頂點集合RF(u),在概率圖上查找以RF(u)集合中的頂點為根的最短路徑,并根據最短路徑計算每一最短路徑上其他頂點到作為根的頂點的依賴分數,最后將所有的依賴分數相加得到的結果作為頂點u的中介中心性。
5.根據權利要求1所述的基于概率圖的基因調控網絡分析方法,其特征在于:所述步驟3包括如下步驟:
步驟3.1:分別對概率圖上頂點的各中心性進行排序并用曲線表示,得到3條曲線,計算各曲線的斜率,選取各曲線上斜率趨于0的頂點的中心性作為閾值;
步驟3.2:篩選其各中心性均大于閾值的頂點,作為該概率圖的關鍵節點。
6.根據權利要求1所述的基于概率圖的基因調控網絡分析方法,其特征在于:在步驟4中,所述計算各源頂點s到目的頂點t且經過關鍵節點的可達概率的方法包括:
步驟I.1:根據步驟3篩選到的關鍵節點,計算關鍵節點之間的可達概率,且根據關鍵節點之間的可達概率構建概率子圖,并采用緊密結構存儲;
步驟I.2:查找出與源頂點可達的所有關鍵節點,并計算源頂點到這些關鍵節點的可達概率;再查找出能夠到達目的頂點的關鍵節點,并計算這些關鍵節點到目的頂點的可達概率;再根據關鍵節點概率子圖查詢出這些關鍵節點之間的可達概率;最后根據源頂點、關鍵節點以及目的頂點之間的可達概率,構建概率查詢子圖;
步驟I.3:在概率查詢子圖上計算各源頂點到目的頂點的可達概率。
7.根據權利要求6所述的基于概率圖的基因調控網絡分析方法,其特征在于:步驟I.1中所述的緊密結構是一個帶權有向無環圖,其中頂點為關鍵節點,有向邊為關鍵節點在概率圖上的指向關系,邊上的權值是一個數組b,數組中只存儲0和1兩個值,數組的長度為采樣的次數,b[i]=0表示在第i次采樣中的圖中該邊不存在,b[i]=1表示第i次采樣中的圖中該邊存在。
8.根據權利要求1所述的基于概率圖的基因調控網絡分析方法,其特征在于:在步驟4中,所述計算各源頂點s到目的頂點t且經過關鍵節點的可達概率的方法包括:
步驟J.1:根據基因調控網絡上關鍵基因的特性,將關鍵節點分為多個獨立的關鍵子圖,篩選到達源頂點或者目的頂點的路徑距離小于路徑距離閾值且可達概率大于可達概率閾值的關鍵節點,作為該源頂點或者目的頂點在各關鍵子圖的代表,稱為代表關鍵節點;
步驟J.2:計算各源頂點經過代表關鍵節點與目的頂點的可達概率。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東北大學,未經東北大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110048797.2/1.html,轉載請聲明來源鉆瓜專利網。





