[發明專利]用于處理大數據的屬性和區間的系統和方法在審
| 申請號: | 201210435249.6 | 申請日: | 2012-11-02 |
| 公開(公告)號: | CN102930025A | 公開(公告)日: | 2013-02-13 |
| 發明(設計)人: | R·巴蓋;A·S·斯托賈維奇;H·J·M·梅杰;C·卡特-施文德勒;M·伊薩德 | 申請(專利權)人: | 微軟公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 上海專利商標事務所有限公司 31100 | 代理人: | 陳斌 |
| 地址: | 美國華*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 處理 數據 屬性 區間 系統 方法 | ||
技術領域
本公開涉及處理大數據,更具體地涉及用于處理大數據的屬性和區間的系統和方法。
背景技術
傳統地,在對給定情境有意義的任何粒度下對數據加時間戳的操作本質上將時間視為無差別的信息。例如,自一億年前起有效的數據被視為與自10分鐘前起有效的數據同等重要。然而,當數據集變得極大時,(例如大數據)時間的無差別表示意味著對時間的無差別處理。對時間的該無差別處理會是低效的,在時間關系很重要的情況下尤其如此(例如相對于絕對時間或相對時間差)。
在此方面,最開始隨著時間流逝,與時間信息相關聯的數據幫助數據變得更結構化,因為時間信息通知隨后對數據的查詢。例如,可以針對特定日期或日期范圍上的薪酬信息,查詢個人或一組個人的歷史薪酬信息。然而,在某個時間點,數據變得如此龐大,以致該時間信息的增加會產生大量分擾信息,這些信息中的多數隨時間變得無關,使得數據隨時間而結構變差。在又一示例中,隨著數據老化,當對當前薪酬信息進行查詢時,雇員離開公司或得到加薪的事實使得較舊數據變得無關或有誤導性。
例如,時間數據庫可使數據與時間戳和/或有效性時間區間相關聯。因此,例如,可在時間點查詢(例如確定特定時間點時的雇員薪酬、特定時間點時的平均雇員薪酬等等)中采用時間戳和/或有效性時間區間。然而,這樣的時間戳和/或有效性時間區間會被視為與所關聯的數據相關的固定值或硬值。即,這樣的時間戳和/或有效性時間區間不會改變,直到該數據被更新。
因此,時間戳和/或有效性時間區間通常被用于時間點查詢,其中這些查詢在其有用性方面有限,因為它們僅對在該給定時間處查詢的特定信息有效,且僅在時間戳和/或有效性時間區間的固定值或硬值上有效。時間戳和/或有效性時間區間必須被更新以計入對相關數據的更新,而且查詢依賴于時間戳和/或有效性時間區間的固定值或硬值。
顯然,隨著數據集合變得如此大,相關聯的時間戳和/或有效性時間區間可能無法充分地計入針對特定查詢的數據變化、集合中的數據的正常老化或考慮、和/或數據集合的最近添加部分的相對重要性。即,數據集合隨時間的結構損失會降低該集合的效用、會需要經更新的查詢計入最近的改變、而且無法計入與這些查詢的有效性有關的外圍相關數據的出現(除非特別查詢),等等。
處理大數據時的上述缺點僅旨在提供常規系統的一些問題的概覽,并且不旨在是窮盡性的。在仔細閱讀了以下詳細描述后,現有技術的其他問題和各非限制性性實施例的對應好處可變得顯而易見。
發明內容
本文提供了簡化的發明內容以幫助能夠對以下更詳細的描述和附圖中的示例性、非限制性實施例的多方面有基本或大體的理解。然而,本發明內容并不旨在是詳盡的或窮盡的。相反,本發明內容的唯一目的在于,以簡化的形式提出與一些示例性、非限制性實施例相關的一些概念,作為以下各實施例的更詳細的描述的序言。
在示例實施例中,一種數據管理方法包括:分析由計算設備接收的數據以確定該數據的一個或多個屬性;基于該分析向該一個或多個屬性分配區間;以及使策略與該一個或多個屬性或區間相關聯以便于對數據的管理。屬性和/或區間能用于影響數據老化策略、數據保持策略、數據組織策略、數據排名策略、以及數據管理的其它功能。此外,該數據管理方法可進一步包括:確定與其它數據的一個或多個關系;基于該一個或多個屬性、區間和/或策略產生和/或存儲與該數據有關的近似結果。
在另一示例實施例中,一種計算設備包括:分析組件,配置成解釋由計算設備接收的數據以確定該數據的一個或多個先前未知或未確定的屬性,以創建該數據的一個或多個屬性;區間組件,配置成基于該數據的該一個或多個屬性將區間分配給該一個或多個屬性,或使該區間與該一個或多個屬性相關聯;以及策略組件,配置成使策略與該一個或多個屬性或區間相關聯,以便于對數據的管理。
在另一示例實施例中,一種計算機可讀存儲介質包括計算機可讀指令,計算機可讀指令響應于執行使計算設備執行操作,這些操作包括解釋由計算設備接收的數據以確定該數據的一個或多個先前未知或未確定的屬性,以創建該數據的一個或多個屬性,以及基于該解釋使區間關聯至該一個或多個屬性。這些操作進一步包括確定與該一個或多個屬性或區間有關的策略,以便于對數據的管理。
以下更詳細地描述其他實施例和各非限制性性示例、場景和實現。
附圖說明
參考附圖進一步描述多個非限制性實施例,在附圖中:
圖1示出流程圖,示出了采用向量時鐘作為輔助來進一步描述多個實施例的示例過程;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于微軟公司,未經微軟公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210435249.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:天線元件及MIMO天線裝置
- 下一篇:一種EVA在線裁切裝置
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





