[發明專利]可實現多維度自由剖析的流量數據處理方法無效
| 申請號: | 201010131551.3 | 申請日: | 2010-03-25 |
| 公開(公告)號: | CN101799830A | 公開(公告)日: | 2010-08-11 |
| 發明(設計)人: | 黃勇堅;吳充;楊基彬;鐘志龍;祁國晟 | 申請(專利權)人: | 北京國雙科技有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 宋松 |
| 地址: | 100086 北京市海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 實現 多維 自由 剖析 流量 數據處理 方法 | ||
技術領域
本發明涉及Web流量分析,尤其涉及一種可實現多維度自由剖析的流量數據處理方法。
背景技術
目前常用的Web流量分析系統,都會內置一些常用的報表,例如省份報表,搜索引擎報表,關鍵詞報表等,這些構成數據流量的維度,其所采用的數據處理方法是每個報表就只需要對其中一張數據庫表進行聚合運算即可,報表與報表之間是沒有關聯的,所以這些報表都是“靜態”的,也就是說,客戶拿到這些報表之后,他無法進行其他操作。他即使對報表中的部分數據產生疑問,也沒有辦法做什么,因為所有分析維度,都是針對全部流量數據的,而不是針對某個報表的其中一部分流量數據。看起來提供了不少分析的維度,但是維度之間都是孤立的,所有維度都是基于全部的流量數據(當然,這里所說的全部的流量數據,準確的說,應該是某一段時間內的全部流量數據)進行分析的,此時,客戶只能看到類似圖1所示孤立的三張報表。客戶拿到此報表之后,也只能對自己的流量有個粗淺的認識,如果客戶有更高級的需求,想交叉分析報表,想對其中一張報表中的部分數據單獨進行分析,例如,客戶想查看來自“北京”和“廣東”的、并且是通過Google搜索過來的流量中,這些訪客都搜索了哪些關鍵詞,以及每個關鍵詞最后都購買了哪些商品,那么這類工具就無法解決了。
發明內容
針對以上缺陷,本發明的目的是提供一種流量數據處理方法,可以實現流量數據的多維度自由剖析。
為實現上述目的,本發明通過以下技術方案實現:
一種可實現多維度自由剖析的流量數據處理方法,采用OLAP(onlineanalytical?processing聯機分析處理)技術,包括以下步驟:
(1)、將原始流量數據進行規范并相應的劃分為6個類別,分別是頁面訪問數據、會話訪問數據、訪客訪問數據、廣告數據、電子商務數據和鼠標點擊數據,為這幾個類別分別建立OLAP事實表(FactTable),不同流量數據之間通過會話標識符和訪客身份標識符建立相應的關聯;
(2)、針對每個數據類別建立適當的維度,將相似的維度歸到一類,建立相應的維度表,表中數據生成唯一主鍵,然后分別和上述6大類別的流量數據會話進行關聯;
(3)、根據上述事實表和維度表建立OLAP數據立方體,通過MDX(Multidimensional?Expressions多維表達式)語言生成最終報表。
本發明通過對原始流量數據進行相應的歸類并建立相應的關聯,同時,對于每個類別的流量數據和所有維度之間,也建立了相應的關聯。使所有歸類后的數據都共用這些維度數據,因此可以使用多維度去逐層剖析數據,實現了對流量數據的多維度自由剖析,用戶可以取出報表中任意一部分流量數據,使用多個維度進行逐步自由的剖析,不斷的篩選,直至得到最終想要的數據報表。
附圖說明
下面根據實施例與附圖對本發明作進一步的詳細說明。
圖1是現有Web流量分析系統所生成的相互孤立的報表形式示意圖;
圖2是采用本發明所述方法歸類之后的數據之間的相關關系圖;
圖3是示例中會話數據的流量數據和維度之間的關系圖;
圖4-圖6是針對原始數據建立維度表和由維度表生成事實表的原理圖;
圖7是根據事實表和維度表所建立的OLAP數據立方體。
具體實施方式
為了實現多維度自由的剖析流量數據,我們WebDissector后臺系統采用了OLAP(online?analytical?processing聯機分析處理)技術,將原始流量數據進行規范并相應的劃分為6個類別,分別是頁面訪問數據、會話訪問數據、訪客訪問數據、廣告數據、電子商務數據和鼠標點擊數據,歸類之后的數據并不是孤立的,而是有一定關聯,關系圖如圖2所示。他們之間的關聯,是通過兩個核心的標識符來實現的,其中一個是會話標識符,用來將同一次會話(我們將同個訪客相近的頁面訪問歸結到一次會話中)的數據,包括廣告數據,點擊數據等串到一起;另外一個是訪客身份標識符,用來唯一標示一個訪客的,我們用此標識符來將一個訪客長期以來的訪問數據串到一起。所有歸類之后的流量數據都包含了這兩個重要的標示符,因此才能建立上圖中的各種復雜的關系。
針對每個數據類別建立適當的維度,對于每個類別的流量數據和所有維度之間,也是有相應的關聯;舉會話數據為例,如圖3所示。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京國雙科技有限公司,未經北京國雙科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010131551.3/2.html,轉載請聲明來源鉆瓜專利網。





