[發明專利]神經網絡提取調控DNA組合模式的訓練和可視化方法及系統有效
| 申請號: | 202110063192.0 | 申請日: | 2021-01-18 |
| 公開(公告)號: | CN112735514B | 公開(公告)日: | 2022-09-16 |
| 發明(設計)人: | 汪小我;魏征 | 申請(專利權)人: | 清華大學 |
| 主分類號: | G16B20/00 | 分類號: | G16B20/00;G16B30/00;G16B40/00;G16B50/00;G06N3/04;G06N3/08;G06N3/12 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙) 11201 | 代理人: | 李巖 |
| 地址: | 10008*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 神經網絡 提取 調控 dna 組合 模式 訓練 可視化 方法 系統 | ||
1.一種神經網絡提取調控DNA組合模式的訓練和可視化方法,其特征在于,包括以下步驟:
S1,獲取具有特定功能的DNA序列和不具有所述特定功能的DNA序列;
S2,對兩種DNA序列進行標注,并將所述具有特定功能的DNA序列和所述不具有所述特定功能的DNA序列使用獨熱編碼表示;
S3,搭建卷積神經網絡,將標注后的DNA序列的獨熱編碼作為輸入,對應DNA序列標注為卷積神經網絡輸出的擬合值,對卷積神經網絡進行訓練,以使卷積神經網絡識別DNA序列;
S4,通過NeuronMotif算法將訓練后的卷積神經網絡解耦,獲得基因調控元件組合模塊,并利用調控元件語法樹進行表示和存儲;
S41,對于卷積神經網絡中的一個神經元,采集一個DNA序列新集合,所述DNA序列新集合中的不同DNA序列具有各種大小的神經元激活值;
S42,分別計算所述DNA序列新集合中的DNA序列在神經網絡各層能夠影響該神經元的所有神經元激活值;
S43,對所述DNA序列新集合進行劃分得到多個DNA序列子集合;
S44,計算每個DNA序列子集合對應的基因功能元件組合模塊的數學表示形式,并利用調控元件語法樹對基因功能元件組合模塊進行表示和存儲;
S431,對于所述DNA序列新集合,從所述神經元所在層開始,從深層到淺層進行檢測,若遇到最大池化層,則根據池化大小K,使用Kmeans算法根據所述DNA序列新集合的序列對應的該池化層淺一層神經元激活值特征,將所述DNA序列新集合聚成K類,每一類對應被劃分的DNA序列子集合;
S432,將劃分的DNA序列子集合都作為一個DNA序列新集合,從聚類發生層開始,再從深層到淺層進行檢測,若遇到最大池化層,則根據池化大小K,使用Kmeans算法根據DNA序列新集合的序列對應的該池化層淺一層神經元激活值特征,將DNA序列新集合聚成K類,每一類對應被劃分的DNA序列子集合;
S433,重復步驟S432直到第一層,得到所述多個DNA序列子集合。
2.根據權利要求1所述的方法,其特征在于,S1進一步包括:
S11,在使用生物實驗手段標注的生物基因組上截取具有所述特定功能的DNA序列片段和不具有述特定功能的DNA序列片段。
3.根據權利要求1所述的方法,其特征在于,S1進一步包括:
S12,通過人工合成DNA序列片段分子,做任意類型的生物功能驗證實驗,確定其中具有所述特定功能的片段分子和不具有所述特定功能的片段分子。
4.根據權利要求1所述的方法,其特征在于,所述對兩種DNA序列進行標注,包括:
將所述具有特定功能的DNA序列標注為正樣本,所述不具有所述特定功能的DNA序列標注為負樣本。
5.根據權利要求1所述的方法,其特征在于,S41進一步包括:
根據神經元接收域大小隨機生成DNA序列,使用遺傳算法優化所述DNA序列,優化目標為所述DNA序列的神經元激活值,遺傳算法中對DNA序列的突變根據神經元激活值對DNA序列的獨熱編碼輸入的梯度大小作為概率進行抽樣,除了保持DNA序列的交叉互換以外,還需要根據神經網絡池化層結構進行循環位移,對遺傳算法優化的中間結果DNA序列進行采樣,采樣的DNA序列不重復,采樣的DNA序列組成各種激活的DNA序列集合。
6.根據權利要求1所述的方法,其特征在于,所述基因功能元件組合模塊的計算表達式為E[E(X|Y)],其中,X為采樣序列的one-hot編碼對應的隨機變量,Y是采樣序列對應的激活值所表示的隨機變量,Y與X之間的關系Y=f(X)由對應的神經元確定,其中隨機變量Y的分布需要給定,是自由變量,隨機變量X依賴于隨機變量Y。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于清華大學,未經清華大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110063192.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種具有三軸補償機構的工件抓取裝置
- 下一篇:多節臂同步伸縮機構及消防車





