[發明專利]一種基于AI的跨設備上網用戶識別方法在審
| 申請號: | 201810515929.6 | 申請日: | 2018-05-25 |
| 公開(公告)號: | CN108830052A | 公開(公告)日: | 2018-11-16 |
| 發明(設計)人: | 唐一梟;崔淵博;阿曼太;王宇;金紅;楊滿智;劉長永 | 申請(專利權)人: | 恒安嘉新(北京)科技股份公司 |
| 主分類號: | G06F21/31 | 分類號: | G06F21/31;G06F17/30 |
| 代理公司: | 北京市萬慧達律師事務所 11111 | 代理人: | 黃玉東 |
| 地址: | 100191 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 上網 上網用戶 跨設備 上網行為 強識別 時間戳數據 構造特征 基礎模型 權重訓練 時間特征 數據添加 梯度增強 樣本檢測 用戶上網 用戶身份 在線學習 統計 識別率 樹算法 訓練集 準確率 跨屏 樣本 回歸 更新 身份 分析 保證 學習 | ||
本發明公開了一種基于AI的跨設備上網用戶識別方法,所述方法包括:提取不同屏下的每個用戶上網的URL數據和時間戳數據,并針對每條數據添加該用戶的身份id;分別統計該用戶的上網意向特征、強識別URL特征及上網時間特征;根據統計完成的上述三個特征中的一種或者多種建立該用戶的基礎模型,并通過梯度增強回歸樹算法對上述每個特征進行權重訓練,得到該用戶最終的上網行為模型;通過形成的所述上網行為模型,識別出跨屏用戶身份。本發明所述的基于AI的跨設備上網用戶識別方法,統計與分析了上網意向、強識別url和上網時間等特征,通過使用多種構造特征對樣本檢測和學習,使用在線學習對識別錯的樣本加入訓練集更新模型,保證了識別率和準確率。
技術領域
本發明屬于網絡安全及互聯網大數據領域,更具體來說,涉及一種基于AI的跨設備上網用戶識別方法。
背景技術
目前已經有基于用戶賬號pin檢測跨屏用戶身份的方法,當前研究的熱點是能夠在不使用用戶賬號pin的情況下識別出跨屏用戶身份的基于數據挖掘和機器學習的檢測技術。
現有技術方案中,常采用“基于用戶賬號pin檢測跨屏用戶身份的方法”來進行檢測;但是,在上述方法,存在如下缺點:
1、漏檢率較高;2、在缺乏用戶賬號pin的情況下很難識別出用戶身份;3、識別效率較低。
基于對用戶上網行為的機器學習算法檢測跨屏用戶身份的方法,是目前一種新型的檢測方法,并且該方法在識別的準確率方面有較大提升。
發明內容
本發明所要解決的問題就是在缺乏用戶賬號pin的情況下如何準確并高效識別出跨屏用戶的身份。
為解決上述技術問題,本發明所采用的技術方案如下:
一種基于AI的跨設備上網用戶識別方法,所述方法包括:
步驟S1、提取不同屏下的每個用戶上網的URL數據和時間戳數據,并針對每條數據添加該用戶的身份id;
步驟S2、分別統計該用戶的上網意向特征、強識別URL特征及上網時間特征;
步驟S3、根據統計完成的上述三個特征中的一種或者多種建立該用戶的基礎模型,并通過梯度增強回歸樹算法對上述每個特征進行權重訓練,得到該用戶最終的上網行為模型;
步驟S4、通過形成的所述上網行為模型,識別出跨屏用戶身份。
進一步地,在所述步驟S2中,所述上網意向特征的獲取方法包括:
通過相似度計算,對用戶上網的URL進行歸并,將子級URL網址同歸到其上一級URL網址,并作為一個上網意向特征。
進一步地,在所述步驟S2中,所述強識別URL特征的獲取方法包括:
檢測用戶不同屏下是否出現相同的URL,如果是,且該URL均指向同一用戶,則從該URL提取數據集作為強識別URL特征。
進一步地,在所述步驟S2中,所述上網時間特征的獲取方法包括:
檢測用戶在不同的設備上的上網時間分布規律。
進一步地,所述方法還包括:
根據每次的識別結果,對模型的權重進行相應的更新。
進一步地,所述上網意向特征的獲取方法還包括:
統計用戶在不同設備下的訪問意愿是否存在相似點;
根據不同的用戶不同的訪問意愿,對用戶的上網行為進行切分;
通過對每次上網行為所訪問的上網意向進行一次權重匹配,計算出每一個用戶的每一個上網意向的權重;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于恒安嘉新(北京)科技股份公司,未經恒安嘉新(北京)科技股份公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810515929.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種設備鎖屏的解鎖方法及裝置
- 下一篇:一種基于網站式的企業產品管理系統





