[發明專利]一種信息處理方法及裝置在審
| 申請號: | 201310652300.3 | 申請日: | 2013-12-05 |
| 公開(公告)號: | CN104699693A | 公開(公告)日: | 2015-06-10 |
| 發明(設計)人: | 毛昊;鐘偉鋒;吳華;冼偉權;黃剛 | 申請(專利權)人: | 中國移動通信集團廣東有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京銀龍知識產權代理有限公司 11243 | 代理人: | 許靜;黃燦 |
| 地址: | 510623 廣東省廣州市珠*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 信息處理 方法 裝置 | ||
技術領域
本發明涉及數據業務領域,特別是涉及一種信息處理方法及裝置。
背景技術
“信息過載”問題隨著信息技術的迅速發展和信息內容的增長而日益嚴重,推薦系統被認為是可以處理此問題的一種有效工具,近年來已經取得了不少研究成果。它通過挖掘用戶所可能感興趣的項目,并對用戶進行推薦。目前,個性化推薦系統已經廣泛應用于移動業務、電子商務,以及信息檢索。尤其對于移動業務而言,隨著移動電話用戶數量的快速增加、移動通信技術的飛速發展以及移動增值數據業務的迅猛增長,帶來了大量的數據業務與應用點,比如無線城市、移動旅游、手機報等。為了使用戶在海量信息中能夠及時、準確得到自己所需要的信息,就需要深入挖掘用戶不同的興趣,從而開展相應的業務推薦以增加活躍用戶數比例是當前提高用戶滿意度和忠誠度的一大重要舉措,個性化信息服務在移動應用中地位日益重要。
目前,個性化推薦技術中已經有很多成熟的方法,但現有的個性化推薦方法主要存在著如下缺陷:(1)只關注精確性問題:推薦算法僅僅關注于用戶感興趣的項目的精確度問題,只圍繞著用戶的偏好推薦,而忽視了用戶偏好的擴展;(2)稀疏性,由于大規模的商品數量和為數眾多的用戶數量,而用戶一般只對自己感興趣的商品評分,所利用表示用戶興趣的信息是十分有限的,而用戶未評分的商品是否是用戶的潛在興趣較難發現。針對此類問題有些方法提出擴展用戶興趣的思路,比如Tangent方法,此類方法存在著計算聯系分時,需要重復計算每個節點彼此之間的相關性,而且只是從純無向圖的角度去建模,忽略了二分圖中用戶與用戶之間沒有聯系的特點;Community-based方法是一種較復雜的協同過濾方法,它通過顯式將用戶與項目分類,從而直接推薦類外項目的思路,思路比較簡單,但事先需要進行聚類、計算量比較大。
發明內容
本發明的目的在于提供一種信息處理方法及裝置,用以解決現有推薦算法中不能充分挖掘用戶的潛在偏好項目節點,項目推薦質量不高的問題。
為了實現上述目的,本發明提供了一種信息處理方法,包括:獲取用戶的項目評分數據集,所述項目評分數據集包括用戶對項目的評分;
獲得用戶-項目評分數據集中每個節點與一待推薦用戶節點的第一相關性權重Wi,所述第一相關性權重為同一類項目中的相關性權重;
計算用戶-項目評分數據集中每個節點與所述待推薦用戶節點的第二相關性權重We,所述第二相關性權重為不同類項目間的相關性權重;
根據所述We和所述Wi,得出每個節點的推薦度W;
根據所述推薦度W確定待推薦項目。
其中,上述信息處理方法,所述獲得用戶-項目評分數據集中一待推薦用戶節點的第一相關性權重Wi的步驟包括:
根據用戶-項目評分數據集建立項目二分圖G=(V,E);其中,V=(V1,V2),V1表示用戶節點;V2表示項目節點;E為邊,邊上的權值為用戶對項目的評分;
選取所述二分圖中的一用戶節點作為所述待推薦用戶節點;
計算所述二分圖中每個節點與所述待推薦用戶節點的第一相關性權重Wi。
其中,所述計算所述二分圖中每個節點與所述待推薦用戶節點的第一相關性權重Wi的步驟包括:
根據所述待推薦用戶節點i,通過隨機游走模型的方法迭代計算出概率分布向量R(t+1);
迭代收斂后,選取穩定的概率分布向量作為第一相關性權重Wi。
其中,所述根據所述待推薦用戶節點i,通過隨機游走模型的方法迭代計算出概率分布向量R的步驟具體為:
通過公式計算出R(t+1),即Wi=R(t+1);
其中,r為返回概率;ej為第j維為1的單位向量,為初始狀態;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國移動通信集團廣東有限公司;,未經中國移動通信集團廣東有限公司;許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310652300.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:提示信息獲取方法和裝置
- 下一篇:一種處理數據的方法和裝置





