[發明專利]一種低存儲開銷的運行時遞推數據溯源方法無效
| 申請號: | 201310034449.5 | 申請日: | 2013-01-30 |
| 公開(公告)號: | CN103177184A | 公開(公告)日: | 2013-06-26 |
| 發明(設計)人: | 李千目;謝新;戚湧;於東軍;侯君;朱長林 | 申請(專利權)人: | 南京理工大學常熟研究院有限公司 |
| 主分類號: | G06F19/00 | 分類號: | G06F19/00 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 215513 江蘇省蘇州市*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 存儲 開銷 運行 時遞推 數據 溯源 方法 | ||
1.一種低存儲開銷的運行時遞推數據溯源方法,其特征在于步驟如下:
第一步,在數據處理系統部署時,記錄其粗粒度起源信息;
第二步,在數據處理系統運行過程中,記錄其細粒度起源信息;
第三步,在數據處理系統中最后一個處理單元產生輸出數據元組時,對該輸出數據元組的起源信息進行遞推,遞推得到數據處理系統中第一個處理單元的觸發運行的時間范圍,將第一個處理單元的觸發運行的時間范圍???????????????????????????????????????????????????與輸出數據元組一起進行持久存儲;
第四步,溯源查詢時,根據存儲在輸出數據元組中的第一個處理單元的觸發運行的時間范圍???,推算出數據處理系統輸入數據流中所有對待溯源輸出數據元組的產生有貢獻的輸入數據元組。
2.根據權利要求1所述的低存儲開銷的運行時遞推數據溯源方法,其特征在于:在數據處理系統部署時,記錄的粗粒度起源信息包括:
a)基于元組數量計算的每個處理單元的計算窗口類型;
b)每個處理單元的計算窗口大小,窗口大小為元組數量。
3.根據權利要求1所述的低存儲開銷的運行時遞推數據溯源方法,其特征在于:在數據處理系統部署時,記錄的粗粒度起源信息包括:
a)基于時間長度計算的每個處理單元的計算窗口類型;
b)每個處理單元的計算窗口大小,窗口大小為時間長度。
4.根據權利要求2或3所述的低存儲開銷的運行時遞推數據溯源方法,其特征在于:在數據處理系統運行過程中,需要持久記錄的細粒度起源信息包括:
a)系統輸入數據流中所有輸入數據元組的值及其進入數據處理系統的時間;
b)系統輸出數據流中所有輸出數據元組的值及其產生時間;
需要臨時存儲的細粒度起源信息包括:
a)每個處理單元每次運行的觸發時間;
b)每個處理單元每次運行的處理延遲。
5.根據權利要求3所述的低存儲開銷的運行時遞推數據溯源方法,其特征在于:在數據處理系統中最后一個處理單元產生輸出數據元組時,對該輸出數據元組的起源信息進行遞推,遞推公式如下:
其中
。
6.根據權利要求5所述的低存儲開銷的運行時遞推數據溯源方法,其特征在于:溯源查詢時,根據存儲在輸出數據元組中的PU1的觸發運行的時間范圍???,推算出數據處理系統輸入數據流中所有對待溯源輸出數據元組的產生有貢獻的輸入數據元組,推算公式如下:
。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京理工大學常熟研究院有限公司,未經南京理工大學常熟研究院有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310034449.5/1.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06F 電數字數據處理
G06F19-00 專門適用于特定應用的數字計算或數據處理的設備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質相關的數據處理方法或系統
G06F19-12 ..用于系統生物學的建模或仿真,例如:概率模型或動態模型,遺傳基因管理網絡,蛋白質交互作用網絡或新陳代謝作用網絡
G06F19-14 ..用于發展或進化的,例如:進化的保存區域決定或進化樹結構
G06F19-16 ..用于分子結構的,例如:結構排序,結構或功能關系,蛋白質折疊,結構域拓撲,用結構數據的藥靶,涉及二維或三維結構的
G06F19-18 ..用于功能性基因組學或蛋白質組學的,例如:基因型–表型關聯,不均衡連接,種群遺傳學,結合位置鑒定,變異發生,基因型或染色體組的注釋,蛋白質相互作用或蛋白質核酸的相互作用





