[發(fā)明專利]一種日志流程模板的提取方法及裝置在審
| 申請?zhí)枺?/td> | 202211065881.6 | 申請日: | 2022-08-31 |
| 公開(公告)號: | CN115454694A | 公開(公告)日: | 2022-12-09 |
| 發(fā)明(設(shè)計)人: | 董惠良;姜學(xué)峰;汪炎平 | 申請(專利權(quán))人: | 浙江中煙工業(yè)有限責(zé)任公司 |
| 主分類號: | G06F11/07 | 分類號: | G06F11/07;G06F40/216;G06N7/00 |
| 代理公司: | 北京維澳專利代理有限公司 11252 | 代理人: | 陳變花 |
| 地址: | 310008 浙*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 日志 流程 模板 提取 方法 裝置 | ||
1.一種日志流程模板的提取方法,其特征在于,包括:
對多條不同的日志記錄數(shù)據(jù)兩兩配對,形成多個第一日志對;
對每個所述第一日志對做預(yù)處理后輸入關(guān)系預(yù)測模型,獲得所述第一日志對的流程順序概率;
利用流程順序概率大于閾值的所有第二日志對構(gòu)建日志記錄有向圖;
采用深度優(yōu)先搜索算法遍歷所述日志記錄有向圖中的所有路徑,獲得日志流程模板。
2.根據(jù)權(quán)利要求1所述的日志流程模板的提取方法,其特征在于,對每個所述第一日志對做預(yù)處理包括:
將所述第一日志對內(nèi)的兩條日志記錄數(shù)據(jù)去除標(biāo)點符號,作為第一句子和第二句子;
將所述第一句子和第二句子分別轉(zhuǎn)化成第一句子向量和第二句子向量;
按照所述第一日志對中兩條日志記錄的順序?qū)⑺龅谝痪渥酉蛄亢退龅诙渥酉蛄渴孜财唇樱纬删渥酉蛄繉Α?/p>
3.根據(jù)權(quán)利要求2所述的日志流程模板的提取方法,其特征在于,利用流程順序概率大于閾值的所有第二日志對構(gòu)建日志記錄有向圖,包括:
按照每個第二日志對中兩條日志記錄的順序?qū)⑴c所述第二日志對對應(yīng)的第三句子向量和第四句子向量的頂點連接,所有第二日志對形成的頂點連線形成所述日志記錄有向圖。
4.根據(jù)權(quán)利要求1所述的日志流程模板的提取方法,其特征在于,對所述關(guān)系預(yù)測模型進(jìn)行訓(xùn)練包括:
采集多條不重復(fù)的日志記錄數(shù)據(jù),形成日志記錄數(shù)據(jù)集;
將所述日志記錄數(shù)據(jù)集中的日志記錄數(shù)據(jù)進(jìn)行兩兩配對,形成日志關(guān)系集;
將所述日志關(guān)系集中的所有第三日志對轉(zhuǎn)化為向量樣本對,形成日志關(guān)系訓(xùn)練集;
利用所述日志關(guān)系訓(xùn)練集對關(guān)系預(yù)測模型進(jìn)行訓(xùn)練。
5.根據(jù)權(quán)利要求4所述的日志流程模板的提取方法,其特征在于,將所述日志記錄數(shù)據(jù)集中的日志記錄數(shù)據(jù)進(jìn)行兩兩配對,形成日志關(guān)系集,具體包括:
提取所述日志記錄數(shù)據(jù)集中的第一日志記錄數(shù)據(jù)和第二日志記錄數(shù)據(jù);
將所述第一日志記錄數(shù)據(jù)和所述第二日志記錄數(shù)據(jù)按照不同順序形成的日志對分別作為第四日志對和第五日志對;
按照所述第一日志記錄數(shù)據(jù)和所述第二日志記錄數(shù)據(jù)的實際業(yè)務(wù)流程順序?qū)λ龅谒娜罩緦退龅谖迦罩緦M(jìn)行標(biāo)注,與所述實際業(yè)務(wù)流程順序相同的日志對作為正樣本,與所述實際業(yè)務(wù)流程順序不同的日志對作為負(fù)樣本;
將所述第四日志對、所述第五日志對及其標(biāo)注形成的集合作為所述日志關(guān)系集。
6.一種日志流程模板的提取裝置,其特征在于,包括第一配對模塊、概率預(yù)測模塊、有向圖獲得模塊、遍歷模塊;
所述第一配對模塊用于對多條不同的日志記錄數(shù)據(jù)兩兩配對,形成多個第一日志對;
所述概率預(yù)測模塊用于對每個所述第一日志對做預(yù)處理后輸入關(guān)系預(yù)測模型,獲得所述第一日志對的流程順序概率;
所述有向圖獲得模塊用于利用流程順序概率大于閾值的所有第二日志對構(gòu)建日志記錄有向圖;
所述遍歷模塊用于采用深度優(yōu)先搜索算法遍歷所述日志記錄有向圖中的所有路徑,獲得日志流程模板。
7.根據(jù)權(quán)利要求6所述的日志流程模板的提取裝置,其特征在于,所述概率預(yù)測模塊包括句子形成模塊、第一向量轉(zhuǎn)化模塊和拼接模塊;
所述句子形成模塊用于將所述第一日志對內(nèi)的兩條日志記錄數(shù)據(jù)去除標(biāo)點符號,作為第一句子和第二句子;
所述第一向量轉(zhuǎn)化模塊用于將所述第一句子和第二句子分別轉(zhuǎn)化成第一句子向量和第二句子向量;
所述拼接模塊用于按照所述第一日志對中兩條日志記錄的順序?qū)⑺龅谝痪渥酉蛄亢退龅诙渥酉蛄渴孜财唇樱纬删渥酉蛄繉Α?/p>
8.根據(jù)權(quán)利要求7所述的日志流程模板的提取裝置,其特征在于,所述有向圖獲得模塊包括頂點連接模塊,所述頂點連接模塊用于按照每個第二日志對中兩條日志記錄的順序?qū)⑴c所述第二日志對對應(yīng)的第三句子向量和第四句子向量的頂點連接,所有第二日志對形成的頂點連線形成所述日志記錄有向圖。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于浙江中煙工業(yè)有限責(zé)任公司,未經(jīng)浙江中煙工業(yè)有限責(zé)任公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211065881.6/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





