[發明專利]一種基于半監督深度學習的絕緣子元件預測系統在審
| 申請號: | 201911265727.1 | 申請日: | 2019-12-11 |
| 公開(公告)號: | CN110942805A | 公開(公告)日: | 2020-03-31 |
| 發明(設計)人: | 周維;阿麗瑪;劉朝銳 | 申請(專利權)人: | 云南大學 |
| 主分類號: | G16B20/00 | 分類號: | G16B20/00;G16B30/10;G16B40/20 |
| 代理公司: | 成都九鼎天元知識產權代理有限公司 51214 | 代理人: | 陽佑虹 |
| 地址: | 650091 云*** | 國省代碼: | 云南;53 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 監督 深度 學習 絕緣子 元件 預測 系統 | ||
本發明公開了一種基于半監督深度學習的絕緣子元件預測系統,包括提取模塊、編碼模塊、訓練模塊和分析模塊;提取模塊、編碼模塊、訓練模塊和分析模塊依次連接;所述提取模塊用于取出DNA中的染色體號序列;編碼模塊用于截取序列并對截取序列編碼;訓練模塊用于訓練并生成絕緣子元件預測模型;分析模塊用于通過訓練后的絕緣子元件預測模型識別分析DNA染色體序列中的絕緣子序列;本發明通過半監督階梯網絡和卷積神經網絡結合,建立了絕緣子元件預測模型,可以有效且精準的識別出DNA序列中的絕緣子序列;同時也有效減小了絕緣子元件識別的成本和工序。
技術領域
本發明涉及生物絕緣子預測領域,尤其是一種基于半監督深度學習的絕緣子元件預測系統。
背景技術
染色質絕緣子是DNA-蛋白質復合物,在核生物學中具有廣泛的功能,概括的來說,絕緣子位于增強子或啟動子和基因之間,用于減少或者阻斷基因表達,或者作為異染色質屏障,絕緣子元件在基因治療中有十分重要的意義,目前在基因治療領域有一個很大的障礙就是由于插入操作引起的基因毒性和基因突變,有效的尋找到短片段的絕緣子元件,能夠阻礙或者調控致病基因的表達,提高基因治療的安全性。
傳統的方式是通過細胞實驗來驗證絕緣子片段,這種方式不僅低效而且價格昂貴。已知的生物信息學方法也不能有效提取絕緣子元件內部的特征(序列模序motif)。
發明內容
本發明的發明目的在于:針對上述存在的問題,提供一種基于半監督深度學習的絕緣子元件預測系統和方法;本發明解決了絕緣子片段驗證效率低,成本高的問題;解決了不能有效提取絕緣子元件內部的特征的問題。
本發明采用的技術方案如下:
一種基于半監督深度學習的絕緣子元件預測系統,包括提取模塊、編碼模塊、訓練模塊和分析模塊;提取模塊、編碼模塊、訓練模塊和分析模塊依次連接;所述提取模塊用于取出DNA中的染色體號序列;編碼模塊用于截取序列并對截取序列編碼;訓練模塊用于訓練并生成絕緣子元件預測模型;分析模塊用于通過訓練后的絕緣子元件預測模型識別分析DNA染色體序列中的絕緣子序列。
進一步的,所述取出DNA中的染色體號序列是由染色體號的開始位置和結束位置之間取出序列。
進一步的,所述編碼模塊通過熱一編碼對序列進行編碼,將序列轉換為矩陣。
進一步的,所述絕緣子元件預測模型是由階梯網絡進行卷積神經網絡訓練建立而成。
進一步的,所述階梯網絡為半監督階梯網絡,包括。
進一步的,所述卷積神經網絡算法為:
進一步的,所述訓練包括:在將截取出的染色體序列進行編碼得到矩陣后;將矩陣輸入神經網絡算法中進行訓練。
綜上所述,由于采用了上述技術方案,本發明的有益效果是:
1、本發明通過半監督階梯網絡和卷積神經網絡結合,建立了絕緣子元件預測模型,可以有效且精準的識別出DNA序列中的絕緣子序列。
2、本發明也有效減小了絕緣子元件識別的成本和工序。
附圖說明
本發明將通過例子并參照附圖的方式說明,其中:
圖1是絕緣子元件預測系統結構圖。
圖2是熱一編碼圖。
其中,1-提取模塊;2-編碼模塊;3-訓練模塊;4-分析模塊。
具體實施方式
本說明書中公開的所有特征,或公開的所有方法或過程中的步驟,除了互相排斥的特征和/或步驟以外,均可以以任何方式組合。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于云南大學,未經云南大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911265727.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種奶制品加工用均質混合設備
- 下一篇:一種智能試情機器公豬





