[發明專利]一種用一維細胞神經網絡檢測DNA序列相似度的方法有效
| 申請號: | 201310552472.3 | 申請日: | 2013-11-08 |
| 公開(公告)號: | CN103544406A | 公開(公告)日: | 2014-01-29 |
| 發明(設計)人: | 紀祿平;郝德水;周龍;黃青君;尹力;楊潔 | 申請(專利權)人: | 電子科技大學 |
| 主分類號: | G06F19/22 | 分類號: | G06F19/22;G06N3/02 |
| 代理公司: | 成都行之專利代理事務所(普通合伙) 51220 | 代理人: | 溫利平 |
| 地址: | 611731 四川省成*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 用一維 細胞 神經網絡 檢測 dna 序列 相似 方法 | ||
1.一種用一維細胞神經網絡檢測DNA序列相似度的方法,包括以下步驟:
(1)、設計一維細胞神經網絡基本模型
將單細胞進行鏈狀排列,各細胞序號依次用“…、i-1、i、i+1、…”來表示,其中的字母i表示細胞的排列序號;
該基本模型中細胞狀態用微分方程組來表示:
其中,方程組(1)中,t表示時間,xi表示細胞i的狀態,A是反饋模板,B是控制模板,Ii、Rx和C分別是三個常量,f(xi(t))是細胞狀態的輸出調制函數;Yi(t)表示細胞i包括自己的鄰域輸出矩陣,Ui(t)表示細胞i包括自己的鄰域輸入,分別表示為:
細胞輸出調制函數f(xi(t))的具體形態為:
(2)、構建一維對稱細胞神經網絡
用步驟(1)設計的一維細胞神經網絡模型,先分別生成主子網CNN1和從子網CNN2,再由二者構建一個一維對偶細胞神經網絡:
在一維對偶細胞神經網絡中,主子網CNN1是固定不動的,而從子網CNN2則是可以沿主子網CNN1平行移動,時間t每增加1,從子網CNN2移動一步,且從子網CNN2每次移動的距離等于主子網CNN1中兩個相連細胞之間的距離;主子網CNN1由細胞0、1、2、…、m-1組成,從子網CNN2由細胞0、1、2、…、n組成;
在一維對偶細胞神經網絡中,令C=1、Rx=1,則用以表示細胞狀態的微分
方程簡化為:
時間T=t+1時,細胞i的輸出yi(t+1)相應被重新定義為:
(3)、利用步驟(2)構建的一維對偶細胞神經網絡,對兩個待檢測相似度的DNA序列進行全局的堿基對齊;
3.1)、對偶細胞網絡的初始化
待匹配的兩個DNA堿基序列S1和S2的堿基數量分別為K1和K2,堿基序列的堿基代碼分別表示為S1(k1)和S2(k2),且0≤k1≤K1-1和0≤k2≤K2-1,則主子網CNN1和從子網CNN2的細胞數量分別被初始化為K1+1和K2+1,即細胞數量m=K1+1和n=K2+1;
用u1(i)和u2(j)表示主子網CNN1的第i個細胞輸入和從子網CNN2的第j個細胞輸入,則滿足0≤i≤K1且0≤j≤K2,主子網CNN1和從子網CNN2中各細胞的細胞輸入分別按公式(5)和公式(6)進行賦值:
其中,符號“*”表示細胞的輸入u設置為空值;
主子網CNN1中的另一個常量參數初始化賦值為Ii=2;主子網CNN1中使用到的反饋模板Α和控制模板B分別初始化為下列兩個常數矩陣:
A=[0?1?0]和B=[0?1?-1];
此外,還要將主子網CNN1中細胞i,i=0,1,..,K1,的初始狀態即t=0時均分別設置為xi(0)=0、yi(0)=0;主子網CNN1的第0個細胞和從子網CNN2第K2個細胞對齊;
3.2)、迭代地計算主子網CNN1中細胞在各時刻的狀態和輸出
時間t每增加1,從子網CNN2沿主子網CNN1的排列需要增加方向移動一步;
對主子網CNN1,如果細胞i的正下方的那個細胞jL存在,則選取其3個鄰域細胞即細胞i-1,i以及從子網CNN2中正處于i正下方的那個細胞jL;在時間t,t=1,2,…,m+n-1時,當時間t和細胞序號i同時滿足條件1≤t≤m+n-1和1≤i≤m+1時,分別計算各細胞的最優狀態和最優輸出而如果細胞i的正下方的那個細胞jL不存在,則不計算細胞最優狀態的和最優輸出值;
所述的最優狀態和最優輸出分別按下列公式計算:
其中,函數max(...)表示求取輸入參數中的最大值,xi-1(t-2)、xi-1(t-1)和xi(t-1)均按公式(3)進行計算;
3.3)、形成細胞的最優輸出矩陣
根據步驟3.2)計算得到主子網CNN1的所有細胞在各時刻的最優狀態和最優輸出,然后按照第1列為細胞1從t=1到n時刻最優輸出、第2列為細胞2從t=2到1+n時刻最優輸出、…、第m列為細胞m從t=m到m+n時刻最優輸出得到主網絡CNN1的最終的細胞最優輸出矩陣Sy;
3.4)、對兩個DNA序列的堿基進行全局對齊
根據步驟3.3)得到的最優輸出矩陣Sy,從矩陣左上角的元素開始,從左至右、從上至下遍歷矩陣,確定最優輸出矩陣Sy中值為1的矩陣元素位置,并將確定好的各元素按順序連接以形成堿基的對齊路徑P;
根據已確定好的堿基對齊路徑P,分三種情況對DNA堿基序列S1和S2進行操作:從第一個元素1開始,如果下一個1位于其下,則在序列S1的當前位置插入符號“*”;如果下一個元素1位于其右側,則在序列S2的當前位置插入符號“*”;如果下一個1剛好位于其右下位置,則不對S2和S2的當前位置做任何操作。
處理完成Sy的第一個元素后,按前述的三種情況繼續處理第二個元素,直到輸出矩陣Sy的全部值為1的元素全部都已經被處理完畢,此時S2和S2已按堿基的排列順序完成了全局對齊;
(4)、計算兩個DNA堿基序列序列S2和S2的全局相似度
定義序列S2和S2的全局相似度為SC(S1,S2),則這兩個DNA堿基序列的全局相似度按如下公式進行計算:
其中,符號Nmatch表示兩個DNA堿基序列S2和S2經全局序列對齊以后,匹配成功的堿基對數量,Len(S1)和Len(S2)分別表示序列S1和S2的實際長度。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于電子科技大學,未經電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310552472.3/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:用于鎂/鋼異質金屬連接的焊接材料及其制備方法
- 下一篇:激光加工方法
- 同類專利
- 專利分類
G06F 電數字數據處理
G06F19-00 專門適用于特定應用的數字計算或數據處理的設備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質相關的數據處理方法或系統
G06F19-12 ..用于系統生物學的建模或仿真,例如:概率模型或動態模型,遺傳基因管理網絡,蛋白質交互作用網絡或新陳代謝作用網絡
G06F19-14 ..用于發展或進化的,例如:進化的保存區域決定或進化樹結構
G06F19-16 ..用于分子結構的,例如:結構排序,結構或功能關系,蛋白質折疊,結構域拓撲,用結構數據的藥靶,涉及二維或三維結構的
G06F19-18 ..用于功能性基因組學或蛋白質組學的,例如:基因型–表型關聯,不均衡連接,種群遺傳學,結合位置鑒定,變異發生,基因型或染色體組的注釋,蛋白質相互作用或蛋白質核酸的相互作用





