[發明專利]一種存儲數據的方法和裝置有效
| 申請號: | 201310505069.5 | 申請日: | 2013-10-23 |
| 公開(公告)號: | CN104572740B | 公開(公告)日: | 2019-09-13 |
| 發明(設計)人: | 劉志容;李川 | 申請(專利權)人: | 華為技術有限公司;四川大學 |
| 主分類號: | G06F16/28 | 分類號: | G06F16/28;G06F16/22 |
| 代理公司: | 深圳市深佳知識產權代理事務所(普通合伙) 44285 | 代理人: | 徐翀 |
| 地址: | 518129 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 關鍵碼 節點屬性信息 存儲數據 節點信息 屬性信息 邊信息 方法和裝置 網絡圖結構 表示信息 節點屬性 原始數據集 節點標識 原始數據 存儲 研究 | ||
本發明實施例公開了一種存儲數據的方法和裝置,該方法包括:一種存儲數據的方法,所述方法包括:獲取原始數據集;從原始數據集中提取表示信息網絡圖結構的信息;其中,所述表示信息網絡圖結構的信息至少包括:節點信息,節點屬性信息,邊信息,和邊屬性信息;所述節點信息至少包括:節點標識和節點屬性關鍵碼;所述節點屬性關鍵碼與所述節點屬性信息具有對應關系;所述邊信息至少包括:邊標識和邊屬性關鍵碼;所述邊屬性關鍵碼與所述邊屬性信息具有對應關系;所述邊用于描述節點與節點之間的聯系;存儲所述提取的節點信息,節點屬性信息,邊信息,和邊屬性信息。本發明實施例提供的方案,使得研究人員還可以關注節點之間關系。
技術領域
本發明涉及數據存儲領域,具體涉及一種存儲數據的方法和裝置。
背景技術
信息網絡(Information Networks)的概念,是對現實空間中海量、多維、復雜結構數據的一般性抽象。信息網絡在社區網絡分析、合作者網絡分析、交通運輸網絡能力計算、蛋白質網絡接收成分分析、犯罪網絡分析等領域都具有重要價值。
在信息網絡環境中,用戶關注的主題信息由簡單的數值度量值(如銷售總量,利潤值),演化成為關注復雜的網絡,如銷售網絡,其中每個節點(Vertex)代表一種商品,節點間的連線(即:邊,Edge)表示不同類物品的共同銷售關系,參見圖1所示的銷售網絡。
經典的在線分析處理(OLAP,Online Analysis Processing)數據倉庫模型是多維數據模型。多維數據模型是一個多維空間,“維”是人們觀察數據的不同角度,可以用于表示某個事物的不同屬性。例如,在分析產品銷售數據時,涉及時間維,產品維,地區維等。現階段沒有統一的多維數據模型。其中,經典的OLAP數據倉庫模型有三種,即:星形模式,雪花模式,和星座模式。
星形模式是多維數據模型的基本結構,其組成包括:中心事實表和維表。其中,中心事實表是星形模式中的核心表,存儲事實的度量值及各個維表的關鍵碼;維表用于保持維的信息,即每個維成員,包括維的屬性信息等。中心事實表通過所存儲的每個維表的關鍵碼值和各維表進行連接。雪花模式是星形模式的變種,在星形模式的基礎上對某些維表進行規范分解。星座模式可以看成是星形模式的匯聚,能滿足多個實施表共享某些維表,進而實現多主體建模。
如圖2所示,對于經典的產品銷售數據來說,星形模式能夠很好的解決其數據組織。對于銷售數據,可以從四個維度考慮,分別是:時間維(Time),商品維(Item),商店維(Branch)和位置維(Location)。該模式包含一個中心事實表(Sales),該中心事實表包含四個維的關鍵碼(如圖2中所示,Time_key,Branch_key,Item_key,Location_key)和兩個度量(如圖2中所示Dollars_sold,Unit_sold)。
星形模式與雪花模式只適合對單個主題建模,無法對多主題進行建模。星座模式能滿足多個事實表共享某些維表進而實現多主題建模,但信息網絡中的主題數據演化成復雜的圖網絡,需要同時保存信息維、拓撲維的信息,星座模式也不適用于在線圖處理的建模。
在傳統OLAP中,科研工作者關注數值型的度量,比如商場中商品的銷售數量,銷售額等數值型數據。多維數據模型是面向傳統OLAP提出的,并不適用于信息網絡中以圖為結構的數據組織。現在科研工作者更加關注商品與商品之間的共同銷售關系,這就涉及對象與對象之間連接關系的建模問題。目前越來越多的數據以網絡圖的形式出現,如社交網絡,合作者網絡,蛋白質網絡等,在這些網絡中科研工作者更加關注實體間的連接關系。傳統的多維數據模型不能合理的對網絡圖數據關系進行存儲及表示,不能合理的關注實體間的連接關系。
發明內容
本發明實施例提供了一種存儲數據的方法和裝置,克服了傳統的多維數據模型不能合理的對網絡圖數據關系進行存儲及表示的問題。
本發明實施例第一方面提供了一種存儲數據的方法,所述方法包括:
獲取原始數據集;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華為技術有限公司;四川大學,未經華為技術有限公司;四川大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310505069.5/2.html,轉載請聲明來源鉆瓜專利網。





