日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]數據處理方法、數據處理裝置及計算機可讀存儲介質有效

專利信息
申請號: 201210367944.3 申請日: 2004-09-15
公開(公告)號: CN102982065A 公開(公告)日: 2013-03-20
發明(設計)人: 喬爾·古爾德;卡爾·范曼;保羅·貝 申請(專利權)人: 起元科技有限公司
主分類號: G06F17/30 分類號: G06F17/30
代理公司: 隆天國際知識產權代理有限公司 72003 代理人: 張艷杰;張浴月
地址: 美國馬*** 國省代碼: 美國;US
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 數據處理 方法 裝置 計算機 可讀 存儲 介質
【說明書】:

本申請是申請日為2004年9月15日、申請號為200480026429.2(國際申請號為PCT/US2004/030144)、發明名稱為“數據歸檔”的中國專利申請的分案申請。

相關申請的參照

本申請要求2003年9月15日提交的No.60/502,908、2003年10月20遞交的No.60/513,038以及2003年12月22日遞交的No.60/532,956的美國臨時申請的權益。上述引用的申請通過參考援引在此。

技術領域

本發明涉及數據歸檔(profling)。

背景技術

存儲的數據集經常包括事先未知各種特性的數據。例如,數據集的值或一般值的范圍,在數據集內不同字段之間的關系,或在不同字段中的值之間的函數依賴性可能是未知的。數據歸檔會涉及到檢查數據集的源,以確定這些特性。數據歸檔系統的用途之一是收集有關數據集的信息,然后該信息用于設計集結區(staging?area),以便在進一步處理之前裝載數據集。然后,基于在數據歸檔過程中收集的信息,在集結區中進行將數據集映射到希望的目標格式和位置所需的轉換。這種轉換可能是必要的,例如,使第三方數據與已有數據存儲器兼容,或者將數據從原來的計算機系統轉移到新的計算機系統。

發明內容

一般而言,在一個方案中,本發明的特征是數據處理方法。接收記錄流,每個記錄包括一個或多個字段和對應值;在多個處理器之間分割所述記錄流;為每個記錄生成在各記錄中具有值的每個字段的字段值對,所述字段值對表示各記錄中的字段和用于所述字段的對應值;為每個處理器生成每個相異字段值對的調查元素,所述調查元素包括表示所述相異字段和所述相異值的字段值對的計數;基于用于各字段的所述調查元素計算所述記錄流中每個字段的統計數字;以及基于對應的統計數字為所述記錄流中的每個字段生成歸檔。

本發明的方案可以包括一個或多個以下特征。

生成在每個記錄中具有值的每個字段的所述字段值對的步驟包括確定記錄中的特定字段是否為條件字段;以及響應于確定所述特定字段為條件字段,確定所述特定字段是否具有值。

記錄流的至少一個記錄包括可變數目的字段。

基于所述統計數字確定格式規范。

為至少一個字段計算直方圖或十分位數統計數字。

基于所述記錄的順序特性計算用于所述記錄流的序列統計數字。

一般而言,在另一個方案中,本發明的特征是數據處理裝置。該數據處理裝置包括:接收模塊,用于接收記錄流,每個記錄包括一個或多個字段和對應值;分割模塊,用于在多個處理器之間分割所述記錄流;字段值對生成模塊,用于為每個記錄生成在各記錄中具有值的每個字段的字段值對,所述字段值對表示各記錄中的字段和用于所述字段的對應值;調查元素生成模塊,用于為每個處理器生成每個相異字段值對的調查元素,所述調查元素包括表示所述相異字段和所述相異值的字段值對的計數;計算模塊,用于基于用于各字段的所述調查元素計算所述記錄流中每個字段的統計數字;以及歸檔生成模塊,用于基于對應的統計數字為所述記錄流中的每個字段生成歸檔。

本發明的方案可以包括一個或多個以下特征。

字段值對生成模塊包括:用于確定記錄中的特定字段是否為條件字段的模塊;以及用于響應于確定所述特定字段為條件字段,確定所述特定字段是否具有值的模塊。記錄流的至少一個記錄包括可變數目的字段。

數據處理裝置還包括用于基于所述統計數字確定格式規范的模塊。

數據處理裝置還包括:用于計算至少一個字段的直方圖或十分位數統計數字的模塊。

數據處理裝置還包括:用于基于所述記錄的順序特性計算用于所述記錄流的序列統計數字的模塊。

一般而言,在再一個方案中,本發明的特征是存儲用于數據處理的計算機程序的計算機可讀存儲介質,所述計算機程序包括用于使計算機系統執行以下操作的指令:接收記錄流,每個記錄包括一個或多個字段和對應值;在多個處理器之間分割所述記錄流;為每個記錄生成在各記錄中具有值的每個字段的字段值對,所述字段值對表示各記錄中的字段和用于所述字段的對應值;為每個處理器生成每個相異字段值對的調查元素,所述調查元素包括表示所述相異字段和所述相異值的字段值對的計數;基于用于各字段的所述調查元素計算所述記錄流中每個字段的統計數字;以及基于對應的統計數字為所述記錄流中的每個字段生成歸檔。

本發明的方案可以包括一個或多個以下特征。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于起元科技有限公司,未經起元科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201210367944.3/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 色妞妞www精品视频| 午夜激情免费电影| 91久久综合亚洲鲁鲁五月天| 自拍偷在线精品自拍偷无码专区 | 91视频一区二区三区| 国产精品黑色丝袜的老师| 国产精品久久久久激情影院| 欧美日韩一区在线视频| www色视频岛国| 国产乱一区二区三区视频| 久久久久久国产精品免费| 国产69精品久久久久久| 日韩偷拍精品| 李采潭伦理bd播放| www亚洲精品| 久久久久久久亚洲视频| 国产一区二区免费在线| 国产区二区| 91波多野结衣| 亚洲自偷精品视频自拍| 国产欧美一区二区三区在线| 激情久久久久久| 午夜亚洲国产理论片一二三四| 国产精品一区二区人人爽| 久久99精| 国产精品白浆一区二区| 国产一区正在播放| 精品国产一区二区三区久久久久久 | 午夜影院一区| 日韩久久精品一区二区三区| 国产88av| 热久久国产| 国产欧美一区二区在线| 日本福利一区二区| 国产97在线播放| 欧美乱战大交xxxxx| 欧美激情午夜| 亚洲精品国产suv| 一区二区三区欧美视频| 国产aⅴ一区二区| 91麻豆精品国产综合久久久久久| 99久精品视频| 91精品久久久久久综合五月天| 欧美高清一二三区| 国精偷拍一区二区三区| 亚洲精品www久久久久久广东| 日本边做饭边被躁bd在线看| 国产精品对白刺激在线观看| 午夜国产一区二区| 久久久中精品2020中文| 强行挺进女警紧窄湿润| 国产精品不卡在线| 欧美日韩国产色综合视频| 亚洲国产aⅴ精品一区二区16| 日本美女视频一区二区| 国产精品一区二区免费| 国产精品亚洲二区| 欧美在线视频一二三区| 日韩av免费网站| 午夜裸体性播放免费观看| 91麻豆精品国产综合久久久久久| 欧美激情在线观看一区| 色噜噜狠狠色综合中文字幕| 午夜大片男女免费观看爽爽爽尤物| 日本精品一区二区三区在线观看视频 | 国产原创一区二区| 日本一区二区三区免费视频| 一区二区三区欧美日韩| 护士xxxx18一19| 日本午夜影视| 亚洲va国产2019| 久久免费精品国产| 国产经典一区二区| 日本一区二区在线电影| 亚洲1区2区3区4区| 国产精品对白刺激在线观看| 蜜臀久久99精品久久久久久网站| 国产高清精品一区二区| 亚洲一区中文字幕| 日韩av在线免费电影| 色噜噜狠狠色综合影视| 亚洲欧美国产精品久久|