[發明專利]路徑分析方法和裝置在審
| 申請號: | 201310585827.9 | 申請日: | 2013-11-19 |
| 公開(公告)號: | CN103605848A | 公開(公告)日: | 2014-02-26 |
| 發明(設計)人: | 洪超;楊基彬 | 申請(專利權)人: | 北京國雙科技有限公司 |
| 主分類號: | G06F17/50 | 分類號: | G06F17/50 |
| 代理公司: | 北京康信知識產權代理有限責任公司 11240 | 代理人: | 吳貴明;張永明 |
| 地址: | 100086 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 路徑 分析 方法 裝置 | ||
技術領域
本發明涉及數據分析領域,具體而言,涉及一種路徑分析方法和裝置。
背景技術
聯機分析處理(On-Line?Analytical?Processing,簡稱為OLAP)是共享多維信息的、針對特定問題的聯機數據訪問和分析的快速軟件技術。它通過對信息的多種可能的觀察形式進行快速、穩定一致和交互性的存取,允許管理決策人員對數據進行深入觀察。決策數據是多維數據,多維數據就是決策的主要內容。OLAP專門設計用于支持復雜的分析操作,側重對決策人員和高層管理人員的決策支持,可以根據分析人員的要求快速、靈活地進行大數據量的復雜查詢處理,并且以一種直觀而易懂的形式將查詢結果提供給決策人員,以便他們準確掌握企業(公司)的經營狀況,了解對象的需求,制定正確的方案。有關OLAP的相關資料可以進一步參見百度百科:http://baike.baidu.com/view/22068.htm?fromId=57810中的描述,在此不再贅述。
路徑導航:路徑是用戶訪問網站的路徑鏈,如從A頁面再訪問B頁面再回到A頁面,再離開,則表示路徑為A->B->A。路徑導航即是通過界面來展示用戶的訪問路徑。
在Olap里,路徑導航主要包括:
前置頁面分析:選定某一個統一資源定位符(Uniform?Resource?Locator,簡稱為URL)路徑,查看訪問本頁面的所有用戶前一個頁面的分布情況;
后置頁面分析:選定某一個URL路徑,查看訪問本頁面的所有用戶后一個頁面的分布情況。
然而,在相關技術中,并沒有采用Olap的實現方式,而是采用了通過查詢數據倉庫來獲得特定URL的前置和后置頁面,并進行相關頁面的指標(例如訪問次數、停留時長等)的統計分析的方法。
相關技術中基于傳統數據倉庫的路徑導航分析方法采用了如下的技術方案:
建立一張路徑訪問表,在路徑訪問表中,包含:列,用戶名(VisitorKey),會話ID(SessionID),當前訪問頁面(PageKey),下一個訪問頁面(NextPageKey);
以相關技術中的前置頁面分析方法為例:根據PageKey=選定頁面,通過NextPageKey去查找下一個頁面的分布情況。
采用上述的技術方案,若是要多級剖析,即分析以某一頁面其特定后置頁面的再后置頁面分布情況,則需要進行表連接操作,并且,需要剖析多少級,便需要多少次的表連接操作。發明人在研究過程中發現,在剖析多級路徑時,由于要進行大量的自連接操作,其執行效率將會很慢。
針對相關技術中通過對數據倉庫中的路徑訪問表進行自連接來進行路徑分析所導致的執行效率低的問題,目前尚未提出有效的解決方案。
發明內容
本發明提供了一種路徑分析方法和裝置,以至少解決相關技術中的上述問題。
根據本發明的一個方面,提供了一種路徑分析方法,包括:建立訪問表,其中,所述訪問表中的每個條目中保存有根據用戶訪問路徑的順序保存的一個用戶訪問的多個路徑的信息;查找所述訪問表中包含特定路徑的條目;根據所述條目,進行特定路徑相關的路徑分析。
優選地,建立所述訪問表包括:獲取數據倉庫中保存的原始訪問表,其中,所述原始訪問表中的每個條目中保存有一個用戶訪問的一個路徑的信息;根據所述原始訪問表,建立所述訪問表。
優選地,在所述特定路徑相關的路徑分析為所述特定路徑的前置分析的情況下,根據所述條目,進行所述特定路徑相關的路徑分析包括:確定所述條目中用戶在訪問所述特定路徑之前所訪問的路徑的信息;確定用戶在訪問所述特定路徑之前所訪問的路徑的分布情況。
優選地,在所述前置分析為N級前置分析的情況下,根據所述條目,進行所述特定路徑相關的路徑分析包括:確定所述條目中用戶在訪問所述特定路徑之前所訪問的N個路徑的信息;確定用戶在訪問所述特定路徑之前所訪問的N個路徑的分布情況,其中,N為正整數。
優選地,在所述特定路徑相關的路徑分析為所述特定路徑的后置分析的情況下,根據所述條目,進行所述特定路徑相關的路徑分析包括:確定所述條目中用戶在訪問所述特定路徑之后的所訪問的路徑的信息;確定用戶在訪問所述特定路徑之后的所訪問的路徑的分布情況。
優選地,在所述后置分析為M級后置分析的情況下,根據所述條目,進行所述特定路徑相關的路徑分析包括:確定所述條目中用戶在訪問所述特定路徑之后的所訪問的M個路徑的信息;確定用戶在訪問所述特定路徑之后的所訪問的M個路徑的分布情況,其中,M為正整數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京國雙科技有限公司,未經北京國雙科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310585827.9/2.html,轉載請聲明來源鉆瓜專利網。





