[發明專利]基于活動知識圖譜的科學工作流圖版推送方法及裝置在審
| 申請號: | 201911258247.2 | 申請日: | 2019-12-10 |
| 公開(公告)號: | CN112948569A | 公開(公告)日: | 2021-06-11 |
| 發明(設計)人: | 孫莎莎;施振生;周長兵;孫夢宇;董大忠;昌燕;馬超;武瑾;芮昀 | 申請(專利權)人: | 中國石油天然氣股份有限公司 |
| 主分類號: | G06F16/335 | 分類號: | G06F16/335;G06F16/36;G06F40/279 |
| 代理公司: | 北京三友知識產權代理有限公司 11127 | 代理人: | 趙平;周永君 |
| 地址: | 100007 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 活動 知識 圖譜 科學 工作流 圖版 推送 方法 裝置 | ||
1.一種基于活動知識圖譜的科學工作流圖版推送方法,其特征在于,包括:
獲取科學工作流需求圖版,所述科學工作流需求圖版包括多個活動槽,所有活動槽之間具有固定結構關系,每個活動槽包括活動或者子工作流;所述活動為最小結構單元,所述子工作流包括多個具有固定結構關系的活動;
基于預設的活動知識圖譜,獲取每個活動槽的候選活動和子工作流集合;所述活動知識圖譜包括多個科學工作流;
基于語義相似度以及結構相似度從每個活動槽的候選活動和子工作流集合中選取出候選活動或者候選子工作流,按照所述科學工作流需求圖版中所有活動槽之間的固定結構關系生成科學工作流圖版;
推送所述科學工作流圖版。
2.根據權利要求1所述的科學工作流圖版推送方法,其特征在于,還包括:
建立所述活動知識圖譜。
3.根據權利要求2所述的科學工作流圖版推送方法,其特征在于,所述建立所述活動知識圖譜,包括:
提取預存儲的科學工作流以及每個活動和子工作流作為命名實體;
抽取各命名實體之間的關系屬性;
對各命名實體進行信息補充,提取各命名實體的標題和文本描述;
根據每個命名實體的標題和文本描述,將原始的科學工作流數據轉換至基于實體和關系的活動知識圖譜。
4.根據權利要求1所述的科學工作流圖版推送方法,其特征在于,所述科學工作流包括有活動集合、子工作流集合以及邊集合,所述邊集合包括所有活動和子工作流的結構關系,所述基于預設的活動知識圖譜,獲取每個活動槽的候選活動和子工作流集合,包括:
確定所述活動知識圖譜中各子工作流以及各活動的語義相關性;
獲取起始點活動槽和終止點活動槽的候選活動和子工作流集合;
根據起始點活動槽和終止點活動槽的候選活動和子工作流集合,以及所述邊集合依次確定其余活動槽的候選活動和子工作流集合。
5.根據權利要求4所述的科學工作流圖版推送方法,其特征在于,所述確定所述活動知識圖譜中各子工作流以及各活動的語義相關性,包括:
將各子工作流和各活動通過第一文檔的形式表示,其中所述文檔包括對應表示的子工作流或活動的名稱和描述信息;
根據所述描述信息獲取每個子工作流或活動的代表性單詞;
將每個所述代表性單詞對應添加到子工作流或活動的名稱中組成一個文本片段,其中所有子工作流或活動的名稱共同組成第二文檔;
將所述第二文檔轉化為biterm主題模型的輸入格式,并輸入至所述biterm主題模型;
基于biterm主題模型的原理,將每種代表性單詞提取為一個主題單元,并統計每個主題單元的概率;
根據每個主題單元的概率生成所述第二文檔的主題比例期望;
根據困惑度、主題相似度平衡biterm主題模型的泛化能力,確定最優主題個數;
針對每種主題,計算所有活動和子工作流下產生該主題的概率平均值;
保留概率平均值不小于設定閾值的主題;其中被保留的主題所對應的所有活動和子工作流具有語義相關性。
6.根據權利要求5所述的科學工作流圖版推送方法,其特征在于,所述基于語義相似度以及結構相似度從每個活動槽的候選活動和子工作流集合中選取出候選活動或者候選子工作流包括:
根據所述候選活動和子工作流集合中的元素計算結構相似度和語義相似度;
根據所述結構相似度和所述語義相似度的比重,對所述候選活動和子工作流集合中的所有活動或子工作流進行相似度排序,得到相似度從高到低的序列;
從所述序列中選取前K個活動或子工作流作為對應活動槽的候選活動或子工作流,K為大于0的正整數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國石油天然氣股份有限公司,未經中國石油天然氣股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911258247.2/1.html,轉載請聲明來源鉆瓜專利網。





