[發明專利]一種基于隱式特征的過程挖掘方法及系統在審
| 申請號: | 201710067896.9 | 申請日: | 2017-02-07 |
| 公開(公告)號: | CN106897396A | 公開(公告)日: | 2017-06-27 |
| 發明(設計)人: | 代飛;林雷蕾;陶大鵬;莫啟;王煒 | 申請(專利權)人: | 云南大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06Q10/06 |
| 代理公司: | 北京卓唐知識產權代理有限公司11541 | 代理人: | 龔潔 |
| 地址: | 650000 云南*** | 國省代碼: | 云南;53 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 特征 過程 挖掘 方法 系統 | ||
1.一種基于隱式特征的過程挖掘方法,其特征在于,包括如下步驟:
輸入原始日志進行日志過濾得到新日志,
尋找在所述新日志中的隱式特征,將所述隱式特征中的2-度循環與并發結構進行區分,
通過任務間的緊鄰度來劃分同類的所述2-度循環,并根據過程挖掘算法進行挖掘得到帶有2-度循環的Petri網模型。
2.根據權利要求1所述的過程挖掘方法,其特征在于,所述日志過濾至少包括:求解基本關系、向量求解以及日志軌跡編輯的步驟,
所述求解基本關系的步驟,用以根據原始日志文件中任務的緊鄰關系求出所有任務之間的關系;
所述向量求解的步驟,用以根據所有任務之間的關系找到形成2-度循環的變體結構的任務;
所述日志軌跡編輯的步驟,用以將放在同一集合的所有任務轉為同一個任務,同時修改所有日志軌跡。
3.根據權利要求1所述的過程挖掘方法,其特征在于,將所述隱式特征中的2-度循環與并發結構進行區分時進一步包括如下條件:
每個任務b前面都出現過一個任務a,且任務a的位置不一樣;
如果,每個任務b前面都出現過一個任務a,且任務b和任務a一樣多;
如果,任務b出現了,則日志軌跡中任務a的出現次數比任務b的出現次數多;
如果,僅出現任務a;
若滿足上述條件時,則任務a與任務b構成2-度循環;
若在日志中任務a既可在任務b的前面,任務b也可在任務a的前面,則任務a和任務b構成并發結構。
4.根據權利要求1所述的過程挖掘方法,其特征在于,通過任務間的緊鄰度來劃分同類的所述2-度循環按照步驟進行:
4-1)如果日志中出現一次任務b緊鄰任務a后面,緊鄰度的值為1,則總緊鄰度值FD加1;
4-2)如果日志中出現一次a執行后,隔著另外一個任務再執行b,則總緊鄰度值FD加0.5;
4-3)按照上面過程類推,每隔一個任務,緊鄰度的值就降一半,再加到總緊鄰度的值上。
5.根據權利要求1所述的過程挖掘方法,其特征在于,過程挖掘算法包括:重新定義基本關系和擴展α算法兩部分:
所述重新定義基本關系,用以在找到2-度循環結構后,通過循環關系和緊鄰關系來重新定義所有任務的順序關系、選擇關系以及并發關系;
所述擴展α算法,通過在經典α算法基礎上插入一步步驟,用于判斷如果任務a和任務b是變體結構,則先還原回來,然后接著執行后續步驟,則得到包含2-度循環結構的過程模型。
6.根據權利要求1所述的過程挖掘方法,其特征在于,所述重新定義基本關系時具體規則如下:
1)如果日志中出現一次任務b緊鄰任務a后面,同時滿足a不緊鄰在b后面或者a與b是2-度循環,則任務a與任務b為順序關系,記為a→b;
2)如果日志中沒有出現過任務b緊鄰任務a后面,同時a也沒有緊鄰在b后面出現過,則任務a與任務b為選擇關系,記為a#b;
3)如果日志中出現一次任務b緊鄰任務a后面,同時滿足a緊鄰在b后面并且a與b不是2-度循環,則任務a與任務b為并發關系,記為a||b。
7.根據權利要求2所述的過程挖掘方法,其特征在于,所述向量求解的步驟具體包括:
7-1)首先將所有的任務集合變成一個NXN的二維矩陣,其中N代表任務個數,矩陣中第i行第j列的值代表這兩個任務的基本關系,初始值全為0;
7-2)然后每一行代表一個任務的與其他任務的所有行為關系,作為一個一維的行為向量;
7-3)最后將通過向量比較,找出所有向量相等且兩者是選擇關系的任務放在同一個集合中。
8.根據權利要求2所述的過程挖掘方法,其特征在于,所述求解基本關系的步驟具體包括:
8-1)如果出現一次任務b緊鄰在任務a后面,且a沒有緊鄰在b后面,則a與b是順序關系,用1表示;
8-2)如果任務b沒有緊鄰在任務a后面,且a沒有緊鄰在b后面,則a與b是選擇關系,用0表示;
8-3)如果存在任務b緊鄰在任務a后面,且存在a緊鄰在b后面,則a與b是并發關系,用2表示。
9.根據權利要求1所述的過程挖掘方法,其特征在于,所述原始日志滿足:局部完備性。
10.一種基于隱式特征的過程挖掘系統,其特征在于,包括:日志過濾器、隱式特征分析器、緊鄰度計算器以及拓展算法挖掘器,
所述日志過濾器,被配置為接收輸入的原始日志進行日志過濾得到新日志,
所述隱式特征分析器,被配置為尋找在所述新日志中的隱式特征,將所述隱式特征中的2-度循環與并發結構進行區分,
所述緊鄰度計算器,被配置為通過任務間的緊鄰度來劃分同類的所述2-度循環,
所述拓展算法挖掘器,被配置為根據過程挖掘算法進行挖掘得到帶有2-度循環的Petri網模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于云南大學,未經云南大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710067896.9/1.html,轉載請聲明來源鉆瓜專利網。





