[發明專利]一種基于多狀態科學工作流的數據世系追溯系統和方法有效
| 申請號: | 201410010013.7 | 申請日: | 2014-01-09 |
| 公開(公告)號: | CN103745319B | 公開(公告)日: | 2017-01-04 |
| 發明(設計)人: | 黃雨;井玉欣;王捍貧;張世琨 | 申請(專利權)人: | 北京大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06Q10/06 |
| 代理公司: | 北京萬象新悅知識產權代理事務所(普通合伙)11360 | 代理人: | 朱紅濤 |
| 地址: | 100871*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 狀態 科學 工作流 數據 世系 追溯 系統 方法 | ||
技術領域
本發明提供了一種基于多狀態科學工作流的數據世系追溯系統和方法,具體涉及一種多任務狀態下科學工作流程實例中,各流程節點之間的數據世系關系追溯方法以及數據世系關系的存儲方式。?
背景技術
在大規模、復雜系統設計制造過程和科學實驗中,比如航天器設計、輪船制造等,通常需要眾多人員協同完成大量的、相互依賴關聯的等量級任務。在這一過程中,顯著的特點就是設計過程和實施過程中涉及到大量任務和海量數據,工作流程高度復雜。?
對于復雜工作流程的管理,在過程方面,由于復雜型號產品的設計過程中通常包括大量的活動節點和參數,同時又要能夠支持多部門多學科的協同設計和優化,這就要求過程管理應關注于各活動節點之間的數據傳遞,以及節點參數之間的映射,所以,過程管理需要能夠控制復雜性,兼顧控制流和數據流,支持流程優化。?
為了解決復雜工作流程的過程管理問題,研究人員將工作流技術被引入到科學研究領域,提出了科學工作流(Scientific?Workflow,SWF)的概念和模型。工作流可以將工作分解成定義良好的任務和角色,按照預先定義好的規則和過程來執行,同時對各項任務進行協調和監控。科學工作流繼承了工作流的優點,通過對任務間數據依賴關系的分析,提供了優化組合的方法,控制各部分在一定約束條件下按序完成,可以有效地控制和管理各活動節點之間的數據流動,推進工作流程向下進行。對于科學研究和復雜系統設計過程中各節點可能出現的迭代研發操作,在科學工作流基礎上增加了節點的狀態管理,以支持工作流程中的執行、重做等操作。?
在數據管理方面,隨著系統復雜度的提高,所涉及的數據越來越多,只關注集成后的結果數據無法保證數據的正確性和一致性,所以分析數據的產生和演化的過程對于評估數據質量、保證數據的正確性和安全性有很大的作用。基于此,在計算機領域中,數據世系概念被提出并成為研究熱點,其重要性已經被多個科學工作流項目所認可,如GridDB,Chimera,myGRID,CMCS等。?
在工作流程中,各活動節點能夠在前置節點完成、輸入數據滿足的情況下啟動執行,執行結束后將得到的數據進行合理存儲,并驅動后續節點的執行;支持任務重做功能,當一個?活動節點重新執行后,其后續節點都應該獲得消息,提示變更;要求能對各活動節點歷次執行的數據進行有效的版本管理,可以根據活動節點的某個數據版本,追溯該版本數據是由之前各前置節點的哪個版本數據所計算得到的,并繪制成世系圖。?
但是這些系統之間對數據世系的表示和查詢都是不同的。例如,Kepler提供了世系記錄器來實時記錄所創建的工作流實例的信息,這些信息包括了工作流上下文,數據歷史,工作流的定義和演化。Taverna則通過使用Semantic網技術構建了四個層次,用來逐層表示世系數據:流程層,數據層,組織層和知識層。同樣的RDFProv系統也使用了Semantic網技術,繼承其可互操作性,擴展性等優點,提供了存儲和查詢關系數據庫管理系統的能力。Chimera使用一種虛擬化數據目錄(VDC)的技術,由一組將可執行任務映射到變換,將任務調用映射到數據變換,將輸入/輸出映射到數據對象的關系組成。VisTrails則是第一個除了支持數據演化歷史,也支持工作流演化世系追蹤的科學工作流管理系統。?
發明內容
針對當前基于科學工作流的復雜系統設計仿真過程和科學研究實驗中,缺乏一個統一的支持多狀態科學工作流的數據世系描述和追溯方法問題,本發明提供了一種基于多狀態科學工作流的數據世系追溯方法,給出了科學工作流過程執行中數據世系的組織機制和挖掘方法。?
本發明的原理是:以基于有向圖的科學工作流過程模型為基礎,對其進行擴展,得到一個擴展的科學工作流過程模型。再利用數據世系技術豐富其數據模型部分,從過程和數據兩個角度全方位地描述科學工作流的執行過程,得到基于多狀態的科學工作流過程數據統一管理模型,并以此對數據世系進行描述和追溯。?
本發明提供的技術方案如下:?
一種基于多狀態科學工作流的數據世系追溯系統,其特征是,包括:系統服務端、用戶端、關系數據庫、數據操作單元、邏輯計算單元;其中,?
所述的系統服務端,為一臺或多臺位于云端或局域網環境的計算機,用以接受工作流用戶的工作流執行請求以及對請求作出反應;?
所述的用戶端,為位于本地的計算機終端,是工作流用戶執行工作流過程的輸入設備;?
所述的關系數據庫,用以保存工作流活動節點信息、邏輯節點信息、數據的依賴關系以及條件約束集等;所述的關系數據庫安裝在系統服務端;?
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京大學,未經北京大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410010013.7/2.html,轉載請聲明來源鉆瓜專利網。





