[發明專利]一種基于鄰居關系的移動用戶基礎屬性預測方法有效
| 申請號: | 201410092544.5 | 申請日: | 2014-03-13 |
| 公開(公告)號: | CN104281634B | 公開(公告)日: | 2018-04-20 |
| 發明(設計)人: | 秦臻;夏勇;程紅蓉 | 申請(專利權)人: | 電子科技大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 611731 四川省*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 鄰居 關系 移動用戶 基礎 屬性 預測 方法 | ||
技術領域
本發明涉及互聯網技術,具體涉及一種基于鄰居關系的移動用戶基礎屬性預測方法的實現方法。
背景技術
在網絡應用中用戶的基礎屬性扮演著重要的角色,用戶基礎屬性預測就是通過分析用戶的瀏覽行為和搜索內容來預測用戶的年齡、性別、收入狀況、地理位置、文化程度、宗教信仰等用戶的基礎屬性。隨著 web2.0 的到來和移動互聯的飛速發展,用戶的基礎屬性在網絡應用中越來越重要,而與之相關的研究內容成為研究的一個熱點。例如 Google 提供的個性化搜索服務,根據用戶的地理位置信息和用戶的搜索歷史記錄為用戶返回個性化的搜索列表,以為用戶提供個性化的搜索服務。
對用戶基礎屬性預測的研究主要集中在用戶的網絡日志和用戶的搜索內容上。對用戶的網絡日志的研究主要是通過研究用戶網絡日志的書寫習慣和用語習慣預測作者的性別和年齡,采取的方法主要是基于文本的分類方法,如 SVM 文本分類。對用戶的搜索內容研究主要是分析用戶的搜索內容和用戶的基礎屬性之間的聯系,已實現對用戶的基礎屬性預測目的,采取的方法一般是統計分析和關聯規則分析。然而,不管是基于搜索內容關聯分析和還是基于習慣的分類預測都不能達到理想的效果,召回率和準確率依然很低。
發明內容
本發明的目的是提供基于鄰居關系的移動用戶基礎屬性預測方法的實現方法。使用本發明提供的實施例,可以通過分析移動用戶的瀏覽行為對用戶的基礎屬性進行預測。
本發明通過分析移動用戶的瀏覽內容,預測用戶的年齡和性別等基礎屬性。從用戶的瀏覽日志出發,根據用戶瀏覽的網頁的內容將網頁歸類,用戶對該類網頁的一次瀏覽視為用戶對該類網頁的一次投票,從而得到用戶的網頁類別點擊矩陣。從用戶的點擊矩陣得出用戶的相似性矩陣,采用 SVD 方法分解用戶的關系矩陣得到用戶的關系反饋矩陣。拼接用戶的點擊矩陣和關系反饋矩陣。通過用戶的 ID 將用戶的基礎屬性和點擊瀏覽請求關聯起來,分析用戶的瀏覽行為和用戶之間的關系,從而通過用戶的瀏覽行為預測用戶的基礎屬性。采用SVM 模型實現對用戶的基礎屬性的分類預測。本發明將用戶的性別作為男和女的二分類問題處理,年齡分段之后作為多分類問題處理。
該方法的步驟包括:
1、爬取用戶訪問的 URL 的內容,通過關鍵字匹配將網頁歸類,得到(用戶ID,網頁類別)值對;
2、將(用戶ID,網頁類別)值對轉化為用戶的點擊矩陣R;
3、由用戶的點擊矩陣計算用戶的相似性,得出用戶的相似性矩陣;
4、相似性做行歸一化,采用SVD方法分解處理后的用戶相似性矩陣,根據SVD分解的物理意義,得到分解矩陣可以隱性的反映用戶間的相互關系,即用戶關系反饋矩陣;
5、合并點擊矩陣和用戶的關系反饋矩陣;
6、通過關鍵字用戶 ID,將用戶點擊矩陣和用戶的基礎屬性關聯,將用戶的基礎屬性設置為類標;
7、用訓練數據訓練SVM分類模型;
8、訓練好的SVM模型分類預測測試樣本;
9、輸出對測試樣本的預測結果;
最后,實施本發明具有以下有益效果:
本發明實施例的有益效果是,通過分析移動用戶的瀏覽行為可以對用戶的性別、年齡等基礎屬性做出預測,其中對性別的預測能夠達到 80%以上的準確率,對年齡組的預測能夠達到 70%以上的準確率。
附圖說明
附圖是本發明提出的一種基于鄰居關系的移動用戶基礎屬性預測方法的算法流程。
具體實施方式
下面結合附圖對本發明的具體實施方式進行描述,以便本領域的技術人員更好地理解本發明。
在本實施例中,如圖所示,提供了本發明提出的方法的算法流程:
步驟 101、爬取用戶訪問的 URL 的內容,通過關鍵字匹配將網頁歸類,得到(用戶ID,網頁類別)值對;
經過關鍵字處理,一條訪問記錄轉化為一個(用戶 ID,網頁類別)值對。
步驟 102 、將(用戶 ID ,網頁類別)值對轉化為用戶的點擊矩陣 R;
統計由訪問日志得到的(用戶 ID,網頁類別)值對,得到網頁類別的總數 n,將同個用戶訪問的網頁類別統計到一行,一次訪問視為對該類網頁的一次投票,多次訪問則為多次投票,最后得到用戶的點擊矩陣。
步驟 103、計算出用戶的相似性矩陣;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于電子科技大學,未經電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410092544.5/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種竹酵素液震動混勻裝置
- 下一篇:一種水產品保鮮用特定水溶液制備機





