[發(fā)明專利]用戶行為數(shù)據(jù)的采集方法及裝置在審
| 申請?zhí)枺?/td> | 201710502434.5 | 申請日: | 2017-06-27 |
| 公開(公告)號: | CN109145194A | 公開(公告)日: | 2019-01-04 |
| 發(fā)明(設(shè)計)人: | 孫鴻鵬 | 申請(專利權(quán))人: | 北京國雙科技有限公司 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F16/955;G06F16/903 |
| 代理公司: | 北京鼎佳達(dá)知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11348 | 代理人: | 王偉鋒;劉鐵生 |
| 地址: | 100086 北京市海淀區(qū)*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 用戶行為數(shù)據(jù) 采集 目標(biāo)網(wǎng)站服務(wù)器 網(wǎng)頁 數(shù)據(jù)采集指令 用戶訪問日志 互聯(lián)網(wǎng)技術(shù) 采集指令 代碼采集 代碼沖突 數(shù)據(jù)文件 響應(yīng)信息 行為信息 用戶下載 客戶端 跳轉(zhuǎn) 合并 應(yīng)用 | ||
本發(fā)明公開了一種用戶行為數(shù)據(jù)的采集方法及裝置,涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,為了解決現(xiàn)有技術(shù)中,在使用用戶行為數(shù)據(jù)采集代碼采集用戶行為數(shù)據(jù)的過程中,當(dāng)用戶行為數(shù)據(jù)采集代碼與網(wǎng)頁自身代碼沖突時,無法有效的采集用戶行為數(shù)據(jù),以及用戶行為數(shù)據(jù)采集代碼無法采集用戶下載的數(shù)據(jù)文件的信息和跳轉(zhuǎn)到達(dá)網(wǎng)頁的信息的問題。本發(fā)明的方法包括:根據(jù)用戶訪問日志生成第一用戶行為數(shù)據(jù);向客戶端發(fā)送數(shù)據(jù)采集指令,并獲取基于數(shù)據(jù)采集指令采集的第二用戶行為數(shù)據(jù);在將第一用戶行為數(shù)據(jù)以及第二用戶行為數(shù)據(jù)中的行為信息進(jìn)行同項合并后,結(jié)合響應(yīng)信息,生成第三用戶行為數(shù)據(jù)。本發(fā)明應(yīng)用于目標(biāo)網(wǎng)站服務(wù)器采集用戶行為數(shù)據(jù)的過程中。
技術(shù)領(lǐng)域
本發(fā)明涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,特別是涉及一種用戶行為數(shù)據(jù)的采集方法及裝置。
背景技術(shù)
隨著互聯(lián)網(wǎng)技術(shù)的日益發(fā)展,使用互聯(lián)網(wǎng)的用戶的數(shù)量也日益增多,為用戶提供服務(wù)的互聯(lián)網(wǎng)網(wǎng)站數(shù)量也越來越多。為了能夠更好的運(yùn)營互聯(lián)網(wǎng)網(wǎng)站以及為用戶提供更好的服務(wù),網(wǎng)站運(yùn)營者在構(gòu)建好網(wǎng)站的基礎(chǔ)上,還需要對大量的用戶訪問網(wǎng)站產(chǎn)生的行為數(shù)據(jù)進(jìn)行統(tǒng)計、分析,以獲取用戶訪問互聯(lián)網(wǎng)網(wǎng)站的行為趨勢。
目前,網(wǎng)站運(yùn)營者將第三方統(tǒng)計平臺提供的用戶行為數(shù)據(jù)采集代碼布署在網(wǎng)站中的網(wǎng)頁中,通過用戶行為數(shù)據(jù)采集代碼來采集用戶訪問網(wǎng)站的行為數(shù)據(jù)。
發(fā)明人在實現(xiàn)上述發(fā)明過程中,發(fā)現(xiàn)現(xiàn)有技術(shù)中,由于構(gòu)建不同網(wǎng)頁所使用的代碼各不相同,當(dāng)用戶行為數(shù)據(jù)采集代碼與待采集用戶行為數(shù)據(jù)的網(wǎng)頁的自身代碼發(fā)生沖突時,會導(dǎo)致用戶行為數(shù)據(jù)采集代碼無法正常的運(yùn)行,從而無法有效的采集用戶行為數(shù)據(jù);同時,由于用戶行為數(shù)據(jù)采集代碼布署在網(wǎng)頁中,因此當(dāng)用戶在網(wǎng)頁中下載某些保存在服務(wù)器中的數(shù)據(jù)文件時,用戶行為數(shù)據(jù)采集代碼只能采集到用戶的下載行為,而采集不到用戶具體下載的數(shù)據(jù)文件的信息,或者,當(dāng)用戶在某網(wǎng)頁中點擊一個鏈接跳轉(zhuǎn)到另一網(wǎng)頁中時,用戶行為數(shù)據(jù)采集代碼只能采集到用戶點擊鏈接的行為,而采集不到跳轉(zhuǎn)后到達(dá)的網(wǎng)頁的信息,從而導(dǎo)致采集到的用戶行為數(shù)據(jù)的準(zhǔn)確性及完整性較低。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明提供的用戶行為數(shù)據(jù)的采集方法及裝置,主要目的在于克服在使用用戶行為數(shù)據(jù)采集代碼采集用戶行為數(shù)據(jù)的過程中,當(dāng)用戶行為數(shù)據(jù)采集代碼與網(wǎng)頁自身代碼沖突時,無法有效的采集用戶行為數(shù)據(jù),以及用戶行為數(shù)據(jù)采集代碼無法采集用戶下載的數(shù)據(jù)文件的信息和跳轉(zhuǎn)到達(dá)網(wǎng)頁的信息的問題,從而提高了采集用戶行為數(shù)據(jù)的準(zhǔn)確性及完整性。
為了解決上述問題,本發(fā)明主要提供如下技術(shù)方案:
第一方面,本發(fā)明提供了一種用戶行為數(shù)據(jù)的采集方法,該方法包括:
根據(jù)用戶訪問日志生成第一用戶行為數(shù)據(jù),其中,所述用戶訪問日志中至少記錄有用戶訪問目標(biāo)網(wǎng)站的第一行為信息,以及所述第一行為信息對應(yīng)的響應(yīng)信息;
向所述客戶端發(fā)送數(shù)據(jù)采集指令,并獲取基于所述數(shù)據(jù)采集指令采集的第二用戶行為數(shù)據(jù),其中,所述數(shù)據(jù)采集指令用于指示所述客戶端根據(jù)用戶訪問目標(biāo)網(wǎng)站的訪問記錄生成所述第二用戶行為數(shù)據(jù),所述第二用戶行為數(shù)據(jù)包含客戶端側(cè)采集到的用戶訪問目標(biāo)網(wǎng)站的第二行為信息;
在將所述第一用戶行為數(shù)據(jù)以及所述第二用戶行為數(shù)據(jù)中的行為信息進(jìn)行同項合并后,結(jié)合所述響應(yīng)信息,生成第三用戶行為數(shù)據(jù)。
可選的,根據(jù)用戶訪問日志生成第一用戶行為數(shù)據(jù)包括:
提取所述用戶訪問日志中的所述第一行為信息以及對應(yīng)的所述響應(yīng)信息;
根據(jù)預(yù)設(shè)分類規(guī)則,對所述第一行為信息以及對應(yīng)的所述響應(yīng)信息進(jìn)行分類,得到至少一個行為數(shù)據(jù)文件,其中,所述預(yù)設(shè)分類規(guī)則用于根據(jù)至少一個分類參數(shù)對所述第一行為信息以及對應(yīng)的所述響應(yīng)信息進(jìn)行歸類;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京國雙科技有限公司,未經(jīng)北京國雙科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710502434.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 一種用戶行為統(tǒng)計方法及系統(tǒng)
- 基于大數(shù)據(jù)的網(wǎng)絡(luò)用戶分類系統(tǒng)
- 基于大數(shù)據(jù)的網(wǎng)絡(luò)用戶分類方法
- 用戶行為數(shù)據(jù)清理方法及裝置
- 用戶行為數(shù)據(jù)的采集方法及裝置
- 用戶行為數(shù)據(jù)分析方法及服務(wù)器
- 智慧網(wǎng)點用戶行為分析方法及裝置、存儲介質(zhì)和終端
- 數(shù)據(jù)查詢方法和裝置
- 一種用于網(wǎng)絡(luò)環(huán)境的用戶行為預(yù)測系統(tǒng)及其方法
- 一種管理平臺中用戶行為預(yù)測方法及系統(tǒng)





