[發(fā)明專利]一種基于隱式特征的過(guò)程挖掘方法及系統(tǒng)在審
| 申請(qǐng)?zhí)枺?/td> | 201710067896.9 | 申請(qǐng)日: | 2017-02-07 |
| 公開(kāi)(公告)號(hào): | CN106897396A | 公開(kāi)(公告)日: | 2017-06-27 |
| 發(fā)明(設(shè)計(jì))人: | 代飛;林雷蕾;陶大鵬;莫啟;王煒 | 申請(qǐng)(專利權(quán))人: | 云南大學(xué) |
| 主分類號(hào): | G06F17/30 | 分類號(hào): | G06F17/30;G06Q10/06 |
| 代理公司: | 北京卓唐知識(shí)產(chǎn)權(quán)代理有限公司11541 | 代理人: | 龔潔 |
| 地址: | 650000 云南*** | 國(guó)省代碼: | 云南;53 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 特征 過(guò)程 挖掘 方法 系統(tǒng) | ||
技術(shù)領(lǐng)域
本發(fā)明涉及業(yè)務(wù)過(guò)程建模技術(shù)領(lǐng)域,特別涉及一種基于隱式特征的過(guò)程挖掘方法及系統(tǒng),能夠從局部完備性日志中挖掘出短循環(huán)。
背景技術(shù)
近年來(lái),社會(huì)經(jīng)濟(jì)的發(fā)展,物聯(lián)網(wǎng)、云計(jì)算等新興技術(shù)革命的出現(xiàn),使得信息系統(tǒng)不僅僅是圍繞處理業(yè)務(wù)數(shù)據(jù)為中心,更多時(shí)候與它們所支持的運(yùn)作流程越來(lái)越緊密。同時(shí),業(yè)務(wù)流程的操作使得信息系統(tǒng)記錄了數(shù)量眾多的事件,如何有效的從這些日志事件中挖掘有價(jià)值的信息是企業(yè)實(shí)現(xiàn)新型商務(wù)智能的一個(gè)重要基礎(chǔ)。
過(guò)程挖掘是實(shí)現(xiàn)上述內(nèi)容的一種主流方法。目前,過(guò)程挖掘主要包括三個(gè)階段:過(guò)程發(fā)現(xiàn)、符合性檢查和過(guò)程改進(jìn)。而從過(guò)程日志中發(fā)現(xiàn)過(guò)程模型是過(guò)程挖掘的關(guān)鍵技術(shù)。因?yàn)椋挥袕娜罩局邪l(fā)現(xiàn)過(guò)程模型,才能進(jìn)行后面符合性檢查和過(guò)程改進(jìn)的階段研究。但從日志中不一定能準(zhǔn)確發(fā)現(xiàn)兩個(gè)任務(wù)是并發(fā)關(guān)系還是短循環(huán)關(guān)系,進(jìn)而影響模型的準(zhǔn)確性。故而,對(duì)過(guò)程模型中短循環(huán)的發(fā)現(xiàn)已成為了業(yè)務(wù)過(guò)程建模領(lǐng)域的處理難題和研究特點(diǎn)。雖然近年來(lái)已有文獻(xiàn)提出了對(duì)短循環(huán)進(jìn)行挖掘的技術(shù)方法,但大多采用人為假定方式。目前,針對(duì)長(zhǎng)度為2的短循環(huán)結(jié)構(gòu)挖掘方式是人為的假定日志軌跡中一定存在固定的行為模式“aba”,這種特征稱之為顯式特征,可以直接從日志中觀察到。但是,現(xiàn)實(shí)情況是存在過(guò)程模型包含2-度循環(huán)結(jié)構(gòu)(由任務(wù)a和任務(wù)b組成),日志文件中卻不存在類似“aba”的顯式特征。因此,有必要研究提出一種基于隱式特征從局部完備性日志中挖掘短循環(huán)的方法。
發(fā)明內(nèi)容
本發(fā)明要解決的技術(shù)問(wèn)題是,提供一種基于隱式特征從局部完備性日志中挖掘短循環(huán)的方法。
解決上述技術(shù)問(wèn)題,本發(fā)明提供了一種基于隱式特征的過(guò)程挖掘方法,包括如下步驟:
輸入原始日志進(jìn)行日志過(guò)濾得到新日志,
尋找在所述新日志中的隱式特征,將所述隱式特征中的2-度循環(huán)與并發(fā)結(jié)構(gòu)進(jìn)行區(qū)分,
通過(guò)任務(wù)間的緊鄰度來(lái)劃分同類的所述2-度循環(huán),并根據(jù)過(guò)程挖掘算法進(jìn)行挖掘得到帶有2-度循環(huán)的Petri網(wǎng)模型。
更進(jìn)一步,所述日志過(guò)濾至少包括:求解基本關(guān)系、向量求解以及日志軌跡編輯的步驟,
所述求解基本關(guān)系的步驟,用以根據(jù)原始日志文件中任務(wù)的緊鄰關(guān)系求出所有任務(wù)之間的關(guān)系;
所述向量求解的步驟,用以根據(jù)所有任務(wù)之間的關(guān)系找到形成2-度循環(huán)的變體結(jié)構(gòu)的任務(wù);
所述日志軌跡編輯的步驟,用以將放在同一集合的所有任務(wù)轉(zhuǎn)為同一個(gè)任務(wù),同時(shí)修改所有日志軌跡。
更進(jìn)一步,將所述隱式特征中的2-度循環(huán)與并發(fā)結(jié)構(gòu)進(jìn)行區(qū)分時(shí)進(jìn)一步包括如下條件:
每個(gè)任務(wù)b前面都出現(xiàn)過(guò)一個(gè)任務(wù)a,且任務(wù)a的位置不一樣;
如果,每個(gè)任務(wù)b前面都出現(xiàn)過(guò)一個(gè)任務(wù)a,且任務(wù)b和任務(wù)a一樣多;
如果,任務(wù)b出現(xiàn)了,則日志軌跡中任務(wù)a的出現(xiàn)次數(shù)比任務(wù)b的出現(xiàn)次數(shù)多;
如果,僅出現(xiàn)任務(wù)a;
若滿足上述條件時(shí),則任務(wù)a與任務(wù)b構(gòu)成2-度循環(huán);
若在日志中任務(wù)a既可在任務(wù)b的前面,任務(wù)b也可在任務(wù)a的前面,則任務(wù)a和任務(wù)b構(gòu)成并發(fā)結(jié)構(gòu)。
由隱式特征分析器實(shí)現(xiàn),從全局角度對(duì)日志中每條軌跡進(jìn)行計(jì)算,如果任務(wù)a與任務(wù)b是并發(fā)關(guān)系,則掃描軌跡是否滿足以下情況:1)如果b出現(xiàn)了,則軌跡中a的出現(xiàn)次數(shù)要比b多;2)每個(gè)b前面都出現(xiàn)過(guò)一個(gè)a,且a的位置不一樣;3)如果只出現(xiàn)a,也認(rèn)為是滿足的;所有規(guī)則都滿足上面3個(gè)要求,則任務(wù)a與任務(wù)b可以構(gòu)成2-度循環(huán),如果要求1改為a與b出現(xiàn)一樣多,則滿足要求1和2的a與b也可以構(gòu)成2-度循環(huán)。
更進(jìn)一步,通過(guò)任務(wù)間的緊鄰度來(lái)劃分同類的所述2-度循環(huán)按照步驟進(jìn)行:
4-1)如果日志中出現(xiàn)一次任務(wù)b緊鄰任務(wù)a后面,緊鄰度的值為1,則總緊鄰度值FD加1;
4-2)如果日志中出現(xiàn)一次a執(zhí)行后,隔著另外一個(gè)任務(wù)再執(zhí)行b,則總緊鄰度值FD加0.5;
4-3)按照上面過(guò)程類推,每隔一個(gè)任務(wù),緊鄰度的值就降一半,再加到總緊鄰度的值上。
由緊鄰度計(jì)算器實(shí)現(xiàn),具體公式如下所示,其中變量m是在每條軌跡中,b出現(xiàn)的次數(shù),n是軌跡的數(shù)量,t是任務(wù)b與任務(wù)a的距離,β是稀釋因子,默認(rèn)β=0.5;其計(jì)算過(guò)程內(nèi)容就是:1)如果日志中出現(xiàn)一次任務(wù)b緊鄰任務(wù)a后面,緊鄰度的值為1,則總緊鄰度值FD加1;2)如果日志中出現(xiàn)一次a執(zhí)行后,隔著另外一個(gè)任務(wù)再執(zhí)行b,則總緊鄰度值FD加0.5;3)按照上面過(guò)程類推,每隔一個(gè)任務(wù),緊鄰度的值就降一半,再加到總緊鄰度的值上。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于云南大學(xué),未經(jīng)云南大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710067896.9/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語(yǔ)言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫(kù)結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)





