[發明專利]一種信息推送方法及設備有效
| 申請號: | 201010246774.4 | 申請日: | 2010-08-03 |
| 公開(公告)號: | CN102346751A | 公開(公告)日: | 2012-02-08 |
| 發明(設計)人: | 張旭;顧海杰;祁建程;蘇寧軍 | 申請(專利權)人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京同達信恒知識產權代理有限公司 11291 | 代理人: | 郭潤湘 |
| 地址: | 英屬開曼群島大開曼*** | 國省代碼: | 開曼群島;KY |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 信息 推送 方法 設備 | ||
技術領域
本申請涉及計算機技術領域,尤其涉及一種信息推送方法及設備。
背景技術
協同過濾(Collaborative?Filtering)技術作為信息過濾的主要技術之一,被廣泛應用于計算機技術下的多種領域的個性化服務系統中。基于條目比較的協同過濾算法(后續簡稱為Itembased算法)是協同過濾算法之一,Itembased算法認為用戶更傾向于獲知與其已操作(如瀏覽、購買item中的商品)過的條目(item)相似或相關的其他item,因此,將item視為由用戶對該item的操作行為構成的向量,從系統提供的數據中搜索與目標item相關的鄰居item集合,并將所述鄰居item集合中各item的信息推送給用戶,使用戶在瀏覽目標item時,可以根據推送的信息方便地瀏覽鄰居item;上述目標item是指某一用戶已操作過的條目,上述鄰居item是指與該目標item相似或相關的其他item。
例如:目標item是A品牌手機,在一段時間內瀏覽過目標item對應頁面的用戶包括:用戶_1、用戶_2和用戶_3。通過對系統中所有item與目標item之間的關聯比較,得出如下結果:
查找出鄰居item_1是B品牌手機,在一段時間內瀏覽過鄰居item_1對應頁面的用戶包括:用戶_1、用戶_2和用戶_4,則表示既瀏覽過目標item對應頁面又瀏覽過鄰居item_1對應頁面的用戶數量為2;
查找出鄰居item_2是C品牌手機,在一段時間內瀏覽過鄰居item_2對應頁面的用戶包括:用戶_1、用戶_2、用戶_3和用戶_4,則表示既瀏覽過目標item對應頁面又瀏覽過鄰居item_2對應頁面的用戶數量為3。
如果上述結果表明鄰居item_1和鄰居item_2與目標item之間的相似度已經滿足需求,則可以將鄰居item_1和鄰居item_2的信息推送給用戶,用戶在瀏覽目標item對應的頁面時,可以方便地瀏覽鄰居item_1和鄰居item_2對應的頁面,使用戶獲得實際需求的有用信息。
在目前的Itembased算法中,如果系統內item的數量為M,則最高需要進行M2次item之間的相似度計算,由于Itembased算法的運算量非常大,導致運算時間長,且無論是否有用的item都要進行相似度運算,導致運算噪音大,運算結果準確性較低;另外,由于進行M2次item之間的相似度計算后產生的數據文件過大,需要占用較大的存儲空間,并且過大的數據文件為后續的搜索過程帶來運算壓力。
發明內容
本申請實施例的目的在于,提供一種信息推送方法及設備,用以解決現有技術中存在的Itembased算法的運算量大和運算噪音大的問題。
一種信息推送方法,所述方法包括:
依次讀取待處理條目item,針對讀取的每個item分別執行:
判斷對讀取的待處理item和目標item都進行操作的用戶數量是否達到門限值;
若未達到門限值,則丟棄所述待處理item;否則,確定所述待處理item與目標item之間的相似度;
在待處理item都讀取完后,將與目標item之間的相似度由高到低的N個待處理item的信息推送給用戶,所述N為正整數。
一種信息推送設備,所述設備包括:
讀取模塊,用于依次讀取待處理條目item,并針對讀取的每個item觸發第一判斷模塊;
第一判斷模塊,用于判斷對讀取的待處理item和目標item都進行操作的用戶數量是否達到門限值;
丟棄模塊,用于在未達到門限值時,丟棄所述待處理item;
相似度確定模塊,用于在達到門限值時,確定所述待處理item與目標item之間的相似度;
推送模塊,用于在待處理item都讀取完后,將與目標item之間的相似度由高到低的N個待處理item的信息推送給用戶,所述N為正整數。
本申請在進行相似度計算時先丟棄明顯無法滿足目標門限值的待處理item,只對與目標item進行操作的相同用戶的用戶數量達到門限值的待處理item進行相似度運算,大大減少了運算量,提高運算效率;將與目標item的相似度明顯較低的待處理item刪除,能夠降低運算噪音,提高運算結果的準確性;同時,由于減少了運算量,運算后得到的數據文件較小,因此,減少了數據文件占用的存儲空間,也提高了后續搜索過程的效率。
附圖說明
圖1為本申請的網絡架構示意圖;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于阿里巴巴集團控股有限公司,未經阿里巴巴集團控股有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010246774.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:食用菌菇根剪
- 下一篇:結構改良的含過濾器的末端風口
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





