[發明專利]保序序列規則挖掘方法在審
| 申請號: | 202210294476.5 | 申請日: | 2022-03-23 |
| 公開(公告)號: | CN114625796A | 公開(公告)日: | 2022-06-14 |
| 發明(設計)人: | 武優西;趙曉倩;李艷;馬鵬飛;耿萌;謝婷萱;楊克帥 | 申請(專利權)人: | 河北工業大學 |
| 主分類號: | G06F16/26 | 分類號: | G06F16/26;G06F16/2455;G06F16/22 |
| 代理公司: | 天津翰林知識產權代理事務所(普通合伙) 12210 | 代理人: | 付長杰 |
| 地址: | 300130 天津市紅橋區*** | 國省代碼: | 天津;12 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 序列 規則 挖掘 方法 | ||
1.一種存儲可執行指令的一個或多個計算機可讀存儲介質,當被一個或多個處理器執行時,使所述一個或多個處理器執行動作,包括:
獲得時間序列數據集中對應時間序列的所有頻繁保序序列模式,構成頻繁保序序列模式集合,
設定最小置信度閾值minconf,
計算頻繁保序序列模式y的前綴子模式x,若前綴子模式的相對順序為頻繁保序序列模式,即前綴子模式的相對順序也為上述獲得的頻繁保序序列模式集合中的元素,則得到保序序列規則x=y,表示在序列中若x出現,那么y將以大概率出現;迭代上述過程,得到所有的保序序列規則;
根據conf(x=y)=sup(y)/sup(x)計算x=y的置信度,sup(y)表示y的支持度,sup(x)表示x的支持度,最終將置信度≥設定的最小置信度閾值minconf的保序序列規則加入到規則集合R中,小于minconf的保序序列規則稱為強保序序列規則,挖掘所有的強保序序列規則。
2.一種系統,包括:一個或多個處理器;以及,存儲可執行指令的存儲器,所述可執行指令在被所述一個或多個處理器執行時,使所述一個或多個處理器執行下述動作,包括:
獲取時間序列數據;
在處理器中對時間序列數據執行保序序列模式挖掘方法,該挖掘方法包括利用模式融合和剪枝策略生成候選模式,計算支持度時依據子模式匹配的結果獲得超模式的匹配情況;
獲得2長度的頻繁保序序列模式集合F2及其對應的位置集合Pos2;
生成m+1長度的候選模式,由m長度的頻繁保序序列模式集Fm對應的子模式位置集合Posm生成m+1長度子模式位置集合Posm+1,其中m表示當前得到的頻繁保序序列模式長度,m的初始值為2,生成m+1長度的模式r的匹配的位置集合為Lr,
位置集合的計算方式有以下兩種情況:
1)一般情況:對于兩個m長度的頻繁保序序列模式p和頻繁保序序列模式q,頻繁保序序列模式p的每個元素分別為元素p1、元素p2、…、元素pm,頻繁保序序列模式q的每個元素分別為元素q1、元素q2、…、元素qm,當頻繁保序序列模式q的前綴子模式的相對順序和頻繁保序序列模式p的后綴子模式的相對順序一致,但是頻繁保序序列模式q的最后一位qm和頻繁保序序列模式p的第一位p1不相等時,生成一個m+1長度候選模式,頻繁保序序列模式p對應的位置集合Lp中的元素分別為元素lp1、元素lp2、…、元素lps,其中s為位置集合Lp中元素的個數,頻繁保序序列模式q對應的位置集合Lq中的元素分別元素lq1、元素lq2、…、元素lqv,其中v為位置集合Lq中元素的個數,生成的m+1長度的候選模式對應的位置集合表示為Lr,集合Lr中的元素分別為集合中的元素分別為元素lr1、元素lr2、…、元素lrt、…、元素lru,其中u為得到的位置集合Lr中元素的個數,計算位置集合Lr中的元素lrt(1≤t≤u)值的方式如下:
分別從第一個位置遍歷位置集合Lp和位置集合Lq中的元素,若lqb=lpa+1(其中lpa為位置集合Lp中的元素,lqb為位置集合Lq中的元素),則lrt=lqb,將所有滿足上述關系的元素加入到位置集合Lr中,最終得到的位置集合Lr即為m+1長度候選模式在序列t中匹配的位置集合;
2)特殊情況:對于兩個m長度的頻繁保序序列模式p和頻繁保序序列模式q,頻繁保序序列模式p的每個元素分別為元素p1、元素p2、…、元素pm,頻繁保序序列模式q的每個元素分別為元素q1、元素q2、…、元素qm,當頻繁保序序列模式q的前綴子模式的相對順序和頻繁保序序列模式p的后綴子模式的相對順序一致,并且頻繁保序序列模式q的最后一位qm和頻繁保序序列模式p的第一位p1相等時,頻繁保序序列模式p和頻繁保序序列模式q通過模式融合得到2個m+1長度的候選模式r和z,頻繁保序序列模式p對應的位置集合Lp中的元素分別為元素lp1、元素lp2、…、元素lps,其中s為位置集合Lp中元素的個數,頻繁保序序列模式q對應的位置集合Lq中的元素分別元素lq1、元素lq2、…、元素lqv,其中v為位置集合Lq中元素的個數,生成的候選模式對應的位置集合為Lr,Lz,模式r對應的集合Lr中的元素分別為元素lr1、元素lr2、…、元素lrt、…、元素lru,其中u為得到的位置集合Lr中元素的個數,模式z對應的位置集合Lz中的元素分別為元素lz1、元素lz2、…、元素lzg、…、元素lzw,其中w為得到的位置集合Lz中元素的個數,計算位置集合Lr中的元素lrt(1≤t≤u)值和位置集合Lz中的元素lzg(1≤g≤w)的方式如下:
分別從第一個元素遍歷位置集合Lp和位置集合Lq中的元素,若lqb=lpa+1,其中lpa為位置集合Lp中的任意元素,lqb為位置集合Lq中的任意元素,接下來需要判斷給定的時間序列t中元素tfirst和元素tend的大小,其中first=lqb-m,end=lqb,若tfirsttend,則lrt=lqb,將所有滿足上述關系的元素加入到位置集合Lr中,最終得到的集合Lr即為m+1長度候選模式r匹配的位置集合;若tfirsttend,則lzg=lqb,將所有滿足上述關系的元素加入到位置集合Lz中,最終得到的集合Lz即為m+1長度候選模式z匹配的位置集合;
上述獲得的與相應候選模式匹配的位置集合中元素的個數即為對應候選模式的支持度,根據支持度判斷其是否是頻繁保序序列模式;
設定最小置信度閾值minconf,
計算頻繁保序序列模式y的前綴子模式x,若前綴子模式的相對順序為頻繁保序序列模式,即前綴子模式的相對順序也為上述獲得的頻繁保序序列模式集合中的元素,則得到保序序列規則x=y,表示在序列中若x出現,那么y將以大概率出現;迭代上述過程,得到所有的保序序列規則;
根據conf(x=y)=sup(y)/sup(x)計算x=y的置信度,sup(y)表示y的支持度,sup(x)表示x的支持度,最終將置信度≥設定的最小置信度閾值minconf的保序序列規則加入到規則集合R中,小于minconf的保序序列規則稱為強保序序列規則,挖掘所有的強保序序列規則稱為保序序列規則挖掘,即實現對時間序列數據的保序序列規則挖掘,用于實現時間序列規則推薦或者預測問題,提高系統運行效率。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于河北工業大學,未經河北工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210294476.5/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種用于家禽肉制品老湯調味料生產系統
- 下一篇:一種微電流防困按摩儀





