[發(fā)明專利]頁面訪問路徑的構(gòu)建方法及系統(tǒng)在審
| 申請?zhí)枺?/td> | 202011610978.1 | 申請日: | 2020-12-30 |
| 公開(公告)號: | CN112632446A | 公開(公告)日: | 2021-04-09 |
| 發(fā)明(設(shè)計)人: | 劉洋 | 申請(專利權(quán))人: | 江蘇蘇寧云計算有限公司 |
| 主分類號: | G06F16/958 | 分類號: | G06F16/958;G06F16/215 |
| 代理公司: | 北京市萬慧達(dá)律師事務(wù)所 11111 | 代理人: | 黃玉東 |
| 地址: | 210042 江蘇省南*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 頁面 訪問 路徑 構(gòu)建 方法 系統(tǒng) | ||
1.一種頁面訪問路徑的構(gòu)建方法,其特征在于,包括:
獲取用戶的訪問會話,所述訪問會話包括多個不同的訪問頁面;
針對訪問會話中的所述訪問頁面進(jìn)行頁面清洗并按照采集時間順序編號;
從多個所述訪問頁面中順序識別出每條路徑的入口訪問頁面,將每個所述入口訪問頁面作為對應(yīng)路徑的首節(jié)點(diǎn),并記錄各首節(jié)點(diǎn)的路徑信息;
若路徑數(shù)量為多個,根據(jù)相鄰所述入口訪問頁面的編號區(qū)間將處于區(qū)間內(nèi)的所述訪問頁面劃分入對應(yīng)的路徑分區(qū);或者,若路徑數(shù)量為一個將全部所述訪問頁面劃分為一個路徑分區(qū);
將屬于各路徑分區(qū)的所述訪問頁面按照由小到大的編號順序一一進(jìn)行轉(zhuǎn)入頁面的匹配,獲取每個訪問頁面的匹配關(guān)系并構(gòu)建路徑節(jié)點(diǎn),同時記錄各路徑節(jié)點(diǎn)的路徑信息;
基于首節(jié)點(diǎn)與路徑節(jié)點(diǎn)的路徑信息,構(gòu)建出頁面訪問路徑樹。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,獲取用戶的訪問會話,所述訪問會話包括多個不同的訪問頁面的方法包括:
獲取預(yù)設(shè)時間內(nèi)用戶通過終端訪問網(wǎng)站時瀏覽的多個訪問頁面,按照時間的先后順序匯總后構(gòu)成訪問會話。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,針對訪問會話中的所述訪問頁面進(jìn)行頁面清洗并按照采集時間順序編號的方法包括:
從所述訪問頁面中識別出爬蟲和/或作弊產(chǎn)生的噪音訪問頁面,對所述噪音訪問頁面進(jìn)行初步清洗剔除;
將保留下的所述訪問頁面在同一訪問會話中,按照采集時間順序編號。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,對所述噪音訪問頁面進(jìn)行初步的清洗剔除之后還包括:
在同一訪問會話中,若比對出兩個連續(xù)的所述訪問頁面為同一訪問頁面,則對其中靠后的所述訪問頁面進(jìn)行二次清洗剔除。
5.根據(jù)權(quán)利要求1-4任一項所述的方法,其特征在于,在步驟從多個所述訪問頁面中順序識別出每條路徑的入口訪問頁面,將每個所述入口訪問頁面作為對應(yīng)路徑的首節(jié)點(diǎn),并記錄各首節(jié)點(diǎn)的路徑信息之前還包括:
構(gòu)建頁面斷點(diǎn)維度表,所述頁面斷點(diǎn)維度表中包括至少一個訪問頁面斷點(diǎn)頁。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,從多個所述訪問頁面中順序識別出每條路徑的入口訪問頁面,將每個所述入口訪問頁面作為對應(yīng)路徑的首節(jié)點(diǎn),并記錄各首節(jié)點(diǎn)的路徑信息的方法包括:
將訪問會話中的所述訪問頁面按照編號順序一一對應(yīng)的與所述頁面斷點(diǎn)維度表比對,并將比對上的訪問頁面定義為新路徑的入口訪問頁面;
將每個所述入口訪問頁面作為對應(yīng)路徑的首節(jié)點(diǎn),并記錄各首節(jié)點(diǎn)的路徑信息為空;
所述路徑的數(shù)量即為所述入口訪問頁面的數(shù)量。
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,將屬于各路徑分區(qū)的所述訪問頁面按照由小到大的編號順序一一進(jìn)行轉(zhuǎn)入頁面的匹配,獲取每個訪問頁面的匹配關(guān)系并構(gòu)建路徑節(jié)點(diǎn),同時記錄各路徑節(jié)點(diǎn)的路徑信息的方法包括:
按照由小到大的編號順序,依次尋找路徑分區(qū)內(nèi)每個所述訪問頁面的轉(zhuǎn)入頁面;
基于每個所述訪問頁面與對應(yīng)轉(zhuǎn)入頁面的匹配關(guān)系,繪制路徑分區(qū)內(nèi)各訪問頁面之間的路徑匹配關(guān)系,在路徑關(guān)系中將所述訪問頁面以路徑節(jié)點(diǎn)的形式表示,并通過路徑信息記載每個路徑節(jié)點(diǎn)的路徑匹配關(guān)系,所述路徑信息還包括轉(zhuǎn)入頁面的坑位點(diǎn)擊信息;
根據(jù)所述路徑匹配關(guān)系,將首節(jié)點(diǎn)與路徑節(jié)點(diǎn)串聯(lián)形成路徑。
8.根據(jù)權(quán)利要求7所述的方法,其特征在于,構(gòu)建頁面訪問路徑樹的方法包括:
匯總訪問會話中各的條路徑,構(gòu)建出頁面訪問路徑樹。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于江蘇蘇寧云計算有限公司,未經(jīng)江蘇蘇寧云計算有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011610978.1/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 存儲器訪問調(diào)度裝置、調(diào)度方法與存儲器訪問控制系統(tǒng)
- 一種限制用戶訪問的方法和裝置
- 一種訪問信息提供方法及系統(tǒng)
- 數(shù)據(jù)訪問權(quán)限的控制方法及裝置
- 基于智能家居系統(tǒng)的訪問授權(quán)方法、裝置及設(shè)備
- 網(wǎng)站訪問請求的動態(tài)調(diào)度方法及裝置
- 基于訪問頻率的監(jiān)測方法、裝置、設(shè)備和計算機(jī)存儲介質(zhì)
- 訪問憑證驗證方法、裝置、計算機(jī)設(shè)備及存儲介質(zhì)
- 一種應(yīng)用訪問控制方法、系統(tǒng)和介質(zhì)
- 異常訪問行為的檢測方法、裝置、電子設(shè)備及存儲介質(zhì)
- 路徑搜索系統(tǒng)、路徑搜索終端和路徑搜索方法
- 路徑計算方法、路徑計算單元及路徑計算系統(tǒng)
- 路徑顯示裝置、路徑顯示方法、路徑顯示程序及路徑顯示系統(tǒng)
- 路徑引導(dǎo)裝置、路徑引導(dǎo)方法及路徑引導(dǎo)程序
- 路徑搜索系統(tǒng)、路徑搜索方法及路徑搜索程序
- 路徑引導(dǎo)裝置、路徑引導(dǎo)方法以及路徑引導(dǎo)程序
- 路徑搜索系統(tǒng)、路徑搜索方法以及路徑搜索程序
- 路徑搜索裝置、路徑搜索系統(tǒng)及路徑搜索方法
- 路徑輸出方法、路徑輸出系統(tǒng)和路徑輸出程序
- 路徑評價裝置、路徑評價系統(tǒng)、路徑評價方法以及路徑評價程序
- 構(gòu)建墊、實(shí)體圖像構(gòu)建物和構(gòu)建構(gòu)建物支撐件的方法
- 支持松耦合的軟件構(gòu)建方法、系統(tǒng)及該系統(tǒng)的實(shí)現(xiàn)方法
- 版本的構(gòu)建系統(tǒng)及方法
- 工程構(gòu)建系統(tǒng)及其構(gòu)建方法
- 實(shí)例構(gòu)建方法、裝置及軟件系統(tǒng)
- 軟件構(gòu)建方法、軟件構(gòu)建裝置和軟件構(gòu)建系統(tǒng)
- 天花板地圖構(gòu)建方法、構(gòu)建裝置以及構(gòu)建程序
- 一種項目構(gòu)建方法、持續(xù)集成系統(tǒng)及終端設(shè)備
- 并行構(gòu)建的方法、裝置及設(shè)備
- 構(gòu)建肺癌預(yù)測模型構(gòu)建方法





