[發(fā)明專利]序列位點重要度的確定方法、裝置、設備及存儲介質有效
| 申請?zhí)枺?/td> | 201710708490.4 | 申請日: | 2017-08-17 |
| 公開(公告)號: | CN107516020B | 公開(公告)日: | 2021-05-14 |
| 發(fā)明(設計)人: | 趙苗苗;陳世雄;林闖;李光林 | 申請(專利權)人: | 中國科學院深圳先進技術研究院 |
| 主分類號: | G16B30/00 | 分類號: | G16B30/00;G16B20/30;G16B40/00 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 518055 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 序列 重要 確定 方法 裝置 設備 存儲 介質 | ||
1.一種序列位點重要度的確定方法,其特征在于,包括:
確定定長序列串集合中序列特征串具有的序列位點數(shù),生成設定數(shù)量的維數(shù)為所述序列位點數(shù)的位點權重向量;
初始化各所述位點權重向量,獲得所述設定數(shù)量的具有初始分量值的初始位點權重向量;
基于選定的最優(yōu)解搜索算法迭代處理各所述初始位點權重向量,獲得目標位點權重向量;
將所述目標位點權重向量中的各目標分量值對應確定為序列特征串中各序列位點的重要度;
其中,所述定長序列串集合的獲取過程為:從一套轉錄因子數(shù)據(jù)中提取多條數(shù)據(jù)長度相同的序列特征串;從Ensembl數(shù)據(jù)庫中得到每條序列特征串對應的目標基因序列和啟動子區(qū)域信息,以判斷相應的序列特征串是否為已確定為轉錄因子結合位點,其中,Ensembl數(shù)據(jù)庫具體存儲了目前已通過生物實驗確定出的轉錄因子結合位點信息;將確定為轉錄因子結合位點的序列特征串記作正序列特征串,并將確定不是轉錄因子結合位點的序列特征串記作負序列特征串;選取為正序列特征串10倍數(shù)量的負序列特征串,同時保證正序列特征串和負序列特征串中各序列位點的數(shù)據(jù)不同;基于確定的正序列特征串和選取的負序列特征串組成定長序列串集合。
2.根據(jù)權利要求1所述的方法,其特征在于,所述初始化各所述位點權重向量,包括:
在設定取值范圍內隨機選定各所述位點權重向量中分量的初始分量值,其中,所述設定取值范圍為(0,1)。
3.根據(jù)權利要求1所述的方法,其特征在于,所述基于選定的最優(yōu)解搜索算法迭代處理各所述初始位點權重向量,獲得目標位點權重向量,包括:
將各所述初始位點權重向量作為所選定遺傳算法中當前種群的個體;
確定所述當前種群中各個體相對于所述定長序列串集合的適應值;
如果當前符合迭代終止條件,則確定符合目標選取條件的目標適應值,將所述目標適應值對應的個體作為目標位點權重向量;
否則,根據(jù)所述適應值確定下一代種群,并將所述下一代種群作為新的當前種群返回執(zhí)行適應值的確定操作。
4.根據(jù)權利要求3所述的方法,其特征在于,所述根據(jù)所述適應值確定下一代種群,包括:
根據(jù)所述適應值從所述當前種群中選取符合設定選擇條件的個體作為下一代候選種群;
根據(jù)設定的交叉算子及變異算子處理所述下一代候選種群中的個體,生成下一代種群。
5.根據(jù)權利要求1所述的方法,其特征在于,在將所述目標位點權重向量中的各目標分量值對應確定為序列特征串中各序列位點的重要度之后,還包括:
根據(jù)所述各序列位點的重要度及設定的相似性打分公式,采用設定的預測策略對所述定長序列串集合中的序列特征串進行轉錄因子結合位點預測。
6.根據(jù)權利要求5所述的方法,其特征在于,所述相似性打分公式表示為:
其中,A表示所述定長序列串集合中的任一序列特征串;B表示所述定長序列串集合中不同于A的標簽為陽性數(shù)據(jù)的序列特征串;A[i]和B[i]分別表示A和B中第i個序列位點的位點數(shù)據(jù);SDNA(A[i],B[i])表示設定的DNA替代矩陣中的替代分數(shù);w(i)表示第i個序列位點的重要度;L表示序列特征串的序列位點數(shù)。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院深圳先進技術研究院,未經(jīng)中國科學院深圳先進技術研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710708490.4/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。





