[發明專利]一種互聯網用戶最大似然地理位置發現方法及發現系統有效
| 申請號: | 201410762954.6 | 申請日: | 2014-12-11 |
| 公開(公告)號: | CN104484389A | 公開(公告)日: | 2015-04-01 |
| 發明(設計)人: | 黃建鵬;陳靜 | 申請(專利權)人: | 焦點科技股份有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;H04L29/12 |
| 代理公司: | 南京瑞弘專利商標事務所(普通合伙) 32249 | 代理人: | 陳建和 |
| 地址: | 210061 江蘇省南*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 互聯網 用戶 最大 地理位置 發現 方法 系統 | ||
1.一種互聯網用戶最大似然地理位置發現方法,其特征在于:首先從網站平臺數據源系統中的原始訪問日志中按提取規則和提取周期提取基礎數據;然后對基礎數據進行加工分類形成用戶信息和Cookie集相關聯的中間層數據;接著對中間層數據進行提取,具體提取規則為:將中間層數據中未登錄用戶的Cookie集置空,抽取出登錄用戶的Cookie集,將登錄用戶的Cookie集關聯原始訪問日志得到登錄用戶的所有訪問信息集,進而得到將登錄用戶的IP集,將登錄用戶的IP集關聯IP地址庫得到登錄用戶在訪問互聯網時的地理位置,將得到的地理位置信息存儲到后臺服務器中并實時或周期性更新;最后對新用戶的訪問信息集使用最大似然算法計算出該用戶最經常活動的地理位置;其中,基礎數據包括一定時長內的非爬蟲的訪問互聯網的時間、用戶名、IP和Cookie信息,IP地址庫用于存放IP段對應的地理位置信息。
2.根據權利要求1所述的互聯網用戶最大似然地理位置發現方法,其特征在于:具體包括如下步驟:
(1)從網站平臺數據源系統中的原始訪問日志中按提取規則和提取周期提取非爬蟲的訪問日志,該部分訪問日志包含用戶訪問互聯網的時間、用戶名、IP和Cookie信息;
(2)從步驟(1)獲得的部分訪問日志中抽取登錄用戶訪問日志,該登錄用戶訪問日志包含用戶訪問互聯網的時間、用戶名、IP和Cookie信息;
(3)從步驟(2)得到的登錄用戶訪問日志中提取登錄用戶的Cookie集;
(4)將登錄用戶的Cookie集關聯原始訪問日志得到登錄用戶的所有訪問信息集,該訪問信息集包括用戶訪問互聯網的時間、用戶名、IP和Cookie;
(5)建立IP地址庫用于存放IP段對應的地理位置信息;
(6)生成用戶訪問地理位置集,具體方法為:將步驟(4)獲取的登錄用戶的所有訪問信息集與步驟(5)獲得的IP地址庫相關聯,生成用戶訪問地理位置集,該用戶訪問地理位置集包括登錄用戶訪問互聯網的時間、用戶名、IP和地理位置;將用戶訪問地理位置集存儲到后臺服務器中并實時或周期性更新;
(7)基于步驟(6)獲得的用戶訪問地理位置集,建立用戶最大似然地理位置算法;
(8)使用步驟(7)得到的用戶最大似然地理位置算法對新的用戶的訪問信息集進行計算,獲得該新的用戶最經常或最可能的進行生產經營活動的地理位置。
3.一種互聯網用戶最大似然地理位置發現系統,其特征在于:包括數據信息采集存儲模塊、數據預處理模塊、用戶地理最大似然計算模塊、IP地址庫管理模塊和用戶最大似然地理結果存儲模塊,其中:
數據信息采集存儲模塊,從網站平臺數據源系統中提取并存儲用戶的原始訪問日志,從原始訪問日志中提取并存儲基礎數據;
數據預處理模塊,從基礎數據中提取登錄用戶的Cookie集,將登錄用戶的Cookie集關聯原始訪問日志,提取登錄用戶的IP集;
IP地址庫管理模塊,用于存儲以及管理從網絡采集到的純真版IP地址庫;
用戶地理最大似然計算模塊,通過登錄用戶的IP集以及純真版IP地址庫,利用最大似然地理位置算法計算新用戶最經常或最可能的進行生產經營活動的地理位置,并對結果進行評估;
用戶最大似然地理結果存儲模塊,用于將新用戶的最經常或最可能的進行生產經營活動的地理位置計算結果顯示在終端顯示器界面。
4.根據權利要求3所述的互聯網用戶最大似然地理位置發現系統,其特征在于:
數據信息采集存儲模塊,包括日志文件存儲管理子模塊和日志文件存儲子模塊;
數據預處理模塊,包括登錄用戶Cookie集提取子模塊和登錄用戶訪問IP集提取子模塊;
IP地址庫管理模塊,用于管理及維護IP段對應國家、省份和城市;
用戶地理最大似然計算模塊,包括最大似然算法管理子模塊、最大似然計算子模塊和結果評估子模塊;
用戶最大似然地理結果存儲模塊,用于存儲用戶地理最大似然計算模塊的計算結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于焦點科技股份有限公司,未經焦點科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410762954.6/1.html,轉載請聲明來源鉆瓜專利網。





