[發明專利]用于獲取用戶屬性信息的方法、裝置及服務器在審
| 申請號: | 201510363062.3 | 申請日: | 2015-06-26 | 
| 公開(公告)號: | CN104933157A | 公開(公告)日: | 2015-09-23 | 
| 發明(設計)人: | 吳海山;汪天一;武政偉;李正學;張潼 | 申請(專利權)人: | 百度在線網絡技術(北京)有限公司 | 
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 | 
| 代理公司: | 北京英賽嘉華知識產權代理有限責任公司 11204 | 代理人: | 王達佐;馬曉亞 | 
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 | 
| 權利要求書: | 查看更多 | 說明書: | 查看更多 | 
| 摘要: | |||
| 搜索關鍵詞: | 用于 獲取 用戶 屬性 信息 方法 裝置 服務器 | ||
技術領域
本申請涉及計算機技術領域,具體涉及終端技術領域,尤其涉及用于獲取用戶屬性信息的方法、裝置及服務器。
背景技術
用戶畫像可以是用戶屬性信息的集合,可以用一個模型來描述用戶的特征。現有技術中,用戶畫像構建的主要方法是基于用戶的線上搜索行為分析用戶的屬性信息。在這種方法中,由于用戶的線上搜索行為中可能存在因惡意用戶偽造的搜索信息等虛擬的用戶搜索行為而造成的噪音,導致用戶畫像的構建結果不準確。此外,基于用戶的線上搜索行為的畫像構建還可能存在文本語義分歧的問題,同一搜索詞可能指向不同的用戶特征,例如用戶搜索“廬山”,可能是關注旅游信息,也可能是喜歡與廬山相關的電影。
另外,現有技術中還有基于用戶實際交易數據的用戶畫像構建方法,基于用戶的線上交易數據進行構建。用戶的線上交易在用戶的行為中為低頻行為,因此無法據其得出全面、完整、準確的用戶屬性信息。
發明內容
鑒于上述現有技術中的缺陷或不足,期望能夠提供一種全面、準確的用戶屬性信息的獲取方法。本申請提供了用于獲取用戶屬性信息的方法、裝置及服務器。
第一方面,本申請提供了一種用于獲取用戶屬性信息的方法,包括:獲取地圖日志信息、定位日志信息和搜索引擎的日志信息;對地圖日志信息、定位日志信息和搜索引擎的日志信息進行預處理,以獲取用戶的相關數據;基于用戶的相關數據獲取用戶的行為特征;以及基于用戶的行為特征確定用戶屬性信息。
在某些實現方式中,對地圖日志信息、定位日志信息和搜索引擎的日志信息進行預處理,包括:對地圖日志信息、定位日志信息和搜索引擎的日志信息所包含的數據進行分析;提取地圖日志信息、定位日志信息和搜索引擎的日志信息中與地理位置和用戶行為相關的數據,作為用戶的相關數據。
在進一步的實現方式中,對地圖日志信息、定位日志信息和搜索引擎的日志信息進行預處理,還包括:通過網絡查找出與地圖日志信息、定位日志信息和搜索引擎的日志信息包含的數據相關的信息作為用戶的相關數據。
在某些實現方式中,用戶的相關數據至少包括位置檢索數據和/或定位數據。其中,位置檢索數據包括以下至少一項:目標位置搜索數據、路線搜索數據和對應的線路信息;以及目標位置的周邊數據。
在進一步的實現方式中,目標位置搜索數據包括以下至少一項:搜索的目的地、搜索的時刻、用戶當前地理位置;路線搜索數據包括以下至少一項:用戶檢索路線的時刻、起始地理位置、目標地理位置、軌跡數據以及對應的出行方式;目標位置的周邊數據包括以下至少一項:目標位置周邊的建筑物數據、交通站點數據、停車場數據。
在某些實現方式中,基于用戶的相關數據獲取用戶的行為特征,包括以下至少一項:基于定位數據對用戶停留的地理位置的分布進行統計和分析,以確定用戶固定活動的地點;基于位置檢索數據獲取用戶的興趣點信息;基于位置檢索數據對用戶的出行方式進行統計和分析,以確定用戶偏好的出行方式;基于定位數據計算用戶之間的相關度,以確定多個用戶的親密程度。
在某些實現方式中,基于用戶的行為特征確定用戶屬性信息,包括:基于用戶的行為特征,采用已訓練的模型確定用戶屬性信息。
在某些實現方式中,用戶屬性信息包括以下至少一項:用戶的年齡段、性別、職業、興趣、收入水平、消費習慣、健康狀況、社會關系以及固定資產狀況。
第二方面,本申請提供了一種用于獲取用戶屬性信息的裝置,包括:第一獲取單元,用于獲取地圖日志信息、定位日志信息和搜索引擎的日志信息;預處理單元,用于對地圖日志信息、定位日志信息和搜索引擎的日志信息進行預處理,以獲取用戶的相關數據;第二獲取單元,用于基于用戶的相關數據獲取用戶的行為特征;以及確定單元,用于基于用戶的行為特征確定用戶屬性信息。
在某些實現方式中,預處理單元用于按如下方式對地圖日志信息、定位日志信息和搜索引擎的日志信息進行預處理:對地圖日志信息、定位日志信息和搜索引擎的日志信息所包含的數據進行分析;提取地圖日志信息、定位日志信息和搜索引擎的日志信息中與地理位置和用戶行為相關的數據,作為用戶的相關數據。
在進一步的實現方式中,預處理單元還用于按如下方式對地圖日志信息、定位日志信息和搜索引擎的日志信息進行預處理:通過網絡查找出與地圖日志信息、定位日志信息和搜索引擎的日志信息包含的數據相關的信息作為用戶的相關數據。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于百度在線網絡技術(北京)有限公司,未經百度在線網絡技術(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510363062.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:圖片處理系統、裝置和方法
- 下一篇:基于Lucene的光譜曲線檢索方法及引擎





