[發明專利]用戶到訪推斷模型建立方法、裝置及存儲介質有效
| 申請號: | 201811252456.1 | 申請日: | 2018-10-25 |
| 公開(公告)號: | CN109635208B | 公開(公告)日: | 2020-10-09 |
| 發明(設計)人: | 李巖巖;胡仁君;段建國;姜愛榮;熊輝 | 申請(專利權)人: | 百度在線網絡技術(北京)有限公司 |
| 主分類號: | G06F16/9537 | 分類號: | G06F16/9537;G06F16/29;G06K9/62 |
| 代理公司: | 北京同立鈞成知識產權代理有限公司 11205 | 代理人: | 朱穎;劉芳 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用戶 到訪 推斷 模型 建立 方法 裝置 存儲 介質 | ||
本發明提供一種用戶到訪推斷模型建立方法、裝置及存儲介質,根據每個用戶的定位數據,確定每個用戶的停留點集合;停留點集合為停留點的聚類集合;根據所有用戶的停留點集合,構建用戶的群組關系;根據每個用戶的停留點集合,構建每個用戶的到訪關系;對構建的群組關系和到訪關系進行向量表征學習,得到用戶到訪推斷模型。通過上述建立方法得到的用戶到訪推斷模型嵌入了用戶群組關系以及用戶歷史到訪關系,與現有技術方案相比,具有較高的預測準確性。
技術領域
本發明實施例涉及信息處理技術領域,尤其涉及一種用戶到訪推斷模型建立方法、裝置及存儲介質。
背景技術
隨著移動互聯網和移動智能終端的不斷發展,終端用戶產生了大量的定位數據,定位數據真實反映了用戶在物理時空中的行為特征?;谟脩舳ㄎ粩祿茢嘤脩舻皆L興趣點(Point of Interest,POI),賦予了用戶定位點更豐富的信息,廣泛應用于用戶畫像、知識圖譜、搜索廣告等領域。具體來說,如果能夠確定或者預測用戶到訪一個POI,例如商場、景區等,則可以準確命中用戶實際需求,從而向用戶終端推送信息。
目前到訪POI推斷主要依據距離最短、貝葉斯、WIFI信號的建模方式展開。其中,距離最短是指將用戶定位點與POI坐標的距離關系進行排序,距離最近POI為到訪POI;貝葉斯方法考量了更多的特征,常用的有到訪時間、POI熱度、距離因子等,各特征具有條件獨立性;WIFI信號的強度建模使用用戶定位時掃描到的WIFI名稱與強度特征,輸入到分類模型,比如支持向量機SVM,對周邊POI進行評分。
上述三種方案是目前工業與學術界進行到訪POI的主要方式,綜合來看無論基于簡單規則還是分類模型,對用戶的社會關系與歷史出行規律等相關特征并不能方便的表征嵌入,造成特征信息的缺失,導致推斷效果不佳。
發明內容
本發明提供的用戶到訪推斷模型建立方法、裝置及存儲介質,由于模型中嵌入了用戶群組關系以及用戶歷史到訪關系,因此具有較高的預測準確性。
本發明的第一方面提供一種用戶到訪推斷模型建立方法,包括:
根據每個用戶的定位數據,確定所述每個用戶的停留點集合;所述停留點集合為停留點的聚類集合;
根據所有用戶的所述停留點集合,構建用戶的群組關系;
根據每個用戶的停留點集合,構建所述每個用戶的到訪關系;
對構建的所述群組關系和所述到訪關系進行向量表征學習,得到所述用戶到訪推斷模型。
在一種可能的實現方式中,所述定位數據包括用戶定位點的位置坐標、到達所述定位點的第一時間、離開所述定位點的第二時間;所述根據每個用戶的定位數據,確定所述每個用戶的停留點集合,包括:
根據所述定位點的所述第一時間和所述第二時間,確定用戶在所述定位點的停留時間;
將所述停留時間大于預設停留時間的定位點作為用戶的停留點;
將所述停留點之間的距離小于預設距離的多個所述停留點進行聚類,確定每個用戶的停留點集合。
在一種可能的實現方式中,所述根據所有用戶的所述停留點集合,構建用戶的群組關系,包括:
根據所有用戶的所述停留點集合,確定存在群組關系的第一用戶集合,所述第一用戶集合為同時出現在同一停留點的至少兩個用戶;
統計在預設時段內所述第一用戶集合中的存在群組關系的所述至少兩個用戶同時出現在同一停留點的第一次數;
根據所述第一用戶集合以及所述第一次數,構建用戶的群組關系。
在一種可能的實現方式中,所述根據每個用戶的停留點集合,構建所述每個用戶的到訪關系,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于百度在線網絡技術(北京)有限公司,未經百度在線網絡技術(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811252456.1/2.html,轉載請聲明來源鉆瓜專利網。





