[發明專利]信息推薦方法和信息推薦系統有效
| 申請號: | 201410746660.4 | 申請日: | 2014-12-08 |
| 公開(公告)號: | CN104391982B | 公開(公告)日: | 2018-07-20 |
| 發明(設計)人: | 黃通文;張俊林 | 申請(專利權)人: | 暢捷通信息技術股份有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京友聯知識產權代理事務所(普通合伙) 11343 | 代理人: | 尚志峰;汪海屏 |
| 地址: | 100094 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 信息 推薦 方法 系統 | ||
本發明提供了一種信息推薦方法和一種信息推薦系統,其中,信息推薦方法的流程包括:根據服務器的行為日志數據庫中的行為日志,生成鄰接矩陣;將鄰接矩陣轉化為超鏈接矩陣;根據超鏈接矩陣,為服務器的預設PageRank模型訓練器選取初始參數;根據初始參數,通過預設PageRank模型訓練器計算PageRank向量,并記錄迭代次數;按照從高到低的方式輸出迭代后的PageRank向量;其中,預設PageRank模型訓練器的計算公式為:通過本發明的技術方案,對原經典的PageRank算法中的權威值平均分配問題和僅考慮出鏈的問題進行了改進,使得在實際應用中的迭代數據更快,并且更能考慮到不同用戶具有不同層次的權威度,從而在實際的企業推薦和搜索中具有更高的搜索和推薦質量。
技術領域
本發明涉及數據處理技術領域,具體而言,涉及一種信息推薦方法和一種信息推薦系統。
背景技術
目前,用戶工作圈中的行為日志包括許多的行為信息,包括用戶和用戶的交互信息、用戶和圈子的交互信息,但是大量的行為信息處于初始沒有挖掘的狀態,我們希望從行為信息中挖掘相關數據去改進搜索和推薦質量。現有技術中的搜索和推薦主要采用的是用戶行為和查詢串分詞與索引匹配的綜合排序的方式。但是,現有技術中的推薦和搜索存在如下兩條缺點:
第一,對于沒有行為信息的用戶的推薦主要還是采用的是索引匹配的方式,但是該方式沒有考慮群體的行為信息或者不能對“行為次數多、具有人氣、比較權威”的用戶進行推薦。
第二,企業的數據雖然真實度比較高、冗余度小,但是當搜索和推薦的數據量比較大的時候,用戶可以在某些字段上采用增加關鍵詞等冗余的方法進行作弊,然后進入索引項,從而欺騙搜索系統。
因此需要一種新的技術方案,可以提升用戶推薦的質量。
發明內容
本發明正是基于上述問題,提出了一種新的技術方案,可以提升用戶推薦的質量。
有鑒于此,本發明的第一方面的實施例提出了一種信息推薦方法,包括:根據所述服務器的行為日志數據庫中的行為日志,生成鄰接矩陣;將所述鄰接矩陣轉化為超鏈接矩陣;根據所述超鏈接矩陣,為所述服務器的預設PageRank模型訓練器選取初始參數;根據所述初始參數,通過所述預設PageRank模型訓練器計算PageRank向量,并記錄迭代次數;按照從高到低的方式輸出迭代后的所述PageRank向量;其中,所述預設PageRank模型訓練器的計算公式為:
其中,PR(A)為被推薦的用戶A的所述PageRank向量,n為推薦所述用戶A的所有用戶的總數,N為涉及到推薦行為的總人數,Ti是推薦所述用戶A的任一用戶,C(Ti)表示所述任一用戶Ti推薦其他用戶的總次數,PR(Ti)為所述任一用戶Ti的所述PageRank向量,i=1,2,...,n。
在現有技術中,Google曾在公開發表的論文中,提到其經典的PageRank模型為以下形式:
其中,PR(A)為被推薦的用戶A的所述PageRank向量,N為網頁的總數,其中網頁Ti是指向網頁A的第i個源頁面(鏈入頁面),C(Ti)為網頁Ti的鏈出頁面的出度總數,i=1,2,...,n。該模型的含義指用戶停留在某個頁面,可能以1-α/N的概率隨機進行瀏覽頁面,可能以α概率順著鏈接瀏覽頁面。
在本發明的技術方案中,針對上述現有技術中隨機跳轉因子α的平均分配的問題以及針對只考慮出度問題(C(Ti))的每個AT用戶賦予相等的權重的問題進行了改進。
其中,對權威值α的改進如下:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于暢捷通信息技術股份有限公司,未經暢捷通信息技術股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410746660.4/2.html,轉載請聲明來源鉆瓜專利網。
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





