[發(fā)明專利]基于包含與演繹分析的精確序列規(guī)則挖掘方法在審
| 申請?zhí)枺?/td> | 201410598480.6 | 申請日: | 2014-10-30 |
| 公開(公告)號: | CN104408290A | 公開(公告)日: | 2015-03-11 |
| 發(fā)明(設(shè)計)人: | 杜承烈;吳其蔓;尤濤;鐘冬 | 申請(專利權(quán))人: | 西北工業(yè)大學 |
| 主分類號: | G06F19/00 | 分類號: | G06F19/00 |
| 代理公司: | 西北工業(yè)大學專利中心 61204 | 代理人: | 王鮮凱 |
| 地址: | 710072 *** | 國省代碼: | 陜西;61 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 包含 演繹 分析 精確 序列 規(guī)則 挖掘 方法 | ||
1.一種基于包含與演繹分析的精確序列規(guī)則挖掘方法,其特征在于包括以下步驟:
步驟一、頻繁閉序列及生成子挖掘:序列按照迭代生長的方式生長,即多序列是由1-序列生成;在挖掘頻繁序列的過程中,首先在時間窗口內(nèi)找到所有的1-頻繁序列,再由1-頻繁序列排列組成2-頻繁序列,并挖掘這些候選2-頻繁序列中的頻繁序列,以此類推;按照頻繁閉序列的定義,從頻繁序列集中再次挖掘頻繁閉序列;然后,根據(jù)生成子的定義,通過比較頻繁序列與其前向擴展即父序列的支持度來檢查此序列的前向擴展是否為生成子;故在得到頻繁序列集后,針對尚未確定為生成子的頻繁序列而言,只要通過比較此序列和它的其他真子序列的支持度就能確定此序列是否是生成子;
步驟二、冗余性檢查:在生成規(guī)則的過程中,通過檢查、過濾機制就能有效避免冗余演繹規(guī)則的產(chǎn)生;但即便如此,由于投影關(guān)系的傳遞性,進行演繹規(guī)則的過濾仍然是復(fù)雜的;為了提高演繹規(guī)則的過濾效率,只需要考慮閉序列和生成子的最大重疊項,對其進行演繹規(guī)則冗余檢查;具體步驟如下:
(a)對于閉序列集和生成子集,遍歷搜索找出這兩個集合的相同序列集,且在相同序列集中找出最長的序列;
(b)找出最長相同序列在閉序列集合生成子集的投影和被投影序列;
(c)根據(jù)定理知規(guī)則間的冗余是由于存在生成子和閉序列的公共相同序列;故最長相同序列的一次投影和被投影過程中,最多只產(chǎn)生兩個規(guī)則,其余規(guī)則均存在規(guī)則間的冗余性;冗余演繹規(guī)則的過濾過程,即對最長相同序列產(chǎn)生的規(guī)則進行過濾即可;
(d)產(chǎn)生無相同序列的生成子和閉序列集合;
步驟三、精確序列規(guī)則的產(chǎn)生:根據(jù)序列規(guī)則的定義,從頻繁閉序列集和生成子集中產(chǎn)生序列規(guī)則;首先,對于給定的閉序列以及其生成子,求出生成子在閉序列上的投影;其次,對于給定的最小可信度,計算閉序列和生成子的支持度比值,若比值大于可信度閾值,則根據(jù)規(guī)則的定義,將此閉序列和生成子構(gòu)成的序列規(guī)則加入到序列規(guī)則集合中。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于西北工業(yè)大學,未經(jīng)西北工業(yè)大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410598480.6/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字數(shù)據(jù)處理
G06F19-00 專門適用于特定應(yīng)用的數(shù)字計算或數(shù)據(jù)處理的設(shè)備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質(zhì)相關(guān)的數(shù)據(jù)處理方法或系統(tǒng)
G06F19-12 ..用于系統(tǒng)生物學的建?;蚍抡妫纾焊怕誓P突騽討B(tài)模型,遺傳基因管理網(wǎng)絡(luò),蛋白質(zhì)交互作用網(wǎng)絡(luò)或新陳代謝作用網(wǎng)絡(luò)
G06F19-14 ..用于發(fā)展或進化的,例如:進化的保存區(qū)域決定或進化樹結(jié)構(gòu)
G06F19-16 ..用于分子結(jié)構(gòu)的,例如:結(jié)構(gòu)排序,結(jié)構(gòu)或功能關(guān)系,蛋白質(zhì)折疊,結(jié)構(gòu)域拓撲,用結(jié)構(gòu)數(shù)據(jù)的藥靶,涉及二維或三維結(jié)構(gòu)的
G06F19-18 ..用于功能性基因組學或蛋白質(zhì)組學的,例如:基因型–表型關(guān)聯(lián),不均衡連接,種群遺傳學,結(jié)合位置鑒定,變異發(fā)生,基因型或染色體組的注釋,蛋白質(zhì)相互作用或蛋白質(zhì)核酸的相互作用





