[發明專利]一種內容推薦方法及內容推薦系統有效
| 申請號: | 201611177415.1 | 申請日: | 2016-12-19 |
| 公開(公告)號: | CN106599226B | 公開(公告)日: | 2020-08-28 |
| 發明(設計)人: | 王娜;王文君;高睿;汪景福;陳昭南 | 申請(專利權)人: | 深圳大學 |
| 主分類號: | G06F16/9536 | 分類號: | G06F16/9536 |
| 代理公司: | 深圳市恒申知識產權事務所(普通合伙) 44312 | 代理人: | 王利彬 |
| 地址: | 518000 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 內容 推薦 方法 系統 | ||
本發明涉及數據分析與處理技術領域,尤其涉及一種用于向目標用戶推薦感興趣內容的內容推薦方法及內容推薦系統。本發明基于自然語言處理中的連續詞袋模型對各用戶的歷史查看內容序列進行學習訓練得到連續詞袋模型,從而得到每個內容的內容向量,再根據每個內容的內容向量獲取目標用戶查看過的內容的相似內容,然后計算目標用戶對各相似內容的興趣度,最后提取出目標用戶興趣度最高的預設數量個內容推薦給目標用戶。本發明不利用內容和用戶的描述信息、屬性或標簽,不會因內容和用戶的信息的缺失導致算法的魯棒性變差。同時,本發明計算速度遠超協同過濾和基于內容的推薦算法。再者,本發明將內容表示成等長的向量,可迎合各種現成的相似度算法。
技術領域
本發明涉及數據分析與處理技術領域,尤其涉及一種用于向目標用戶推薦感興趣內容的內容推薦方法及內容推薦系統。
背景技術
隨著人們逐漸步入信息時代,當今世界正處于信息大爆炸的環境下,并且面臨著嚴峻的信息過剩問題。僅在2011年,全球數據量就達到了1.8ZB,相當于全世界每個人產生200GB以上的數據。這種增長趨勢仍在加速,據保守預計,接下來幾年中,數據將始終保持每年50%的增長速度。如今,各大電商、視頻播放等平臺用戶每天都將產生海量的數據,因此如何有效地利用用戶產生的數據是當今互聯網企業亟需解決的問題。這時候個性化的推薦系統作為數據挖掘的手段便應運而生了。推薦系統指的是互聯網站向用戶提供產品信息或建議,讓用戶發現自己潛在的興趣和需求并幫助用戶選擇產品。
傳統的相關視頻推薦算法有基于視頻的協同過濾和基于內容的相關推薦。基于視頻的協同過濾使用用戶對視頻的偏好,發現視頻間的相似度,然后根據用戶的歷史偏好信息將相似視頻推薦給用戶。基于視頻的協同過濾根據用戶-視頻評分矩陣計算視頻間的相似度,從而確定目標視頻的鄰居視頻,再向目標用戶推薦與其歷史觀看的視頻相似度高的視頻,其中查找用戶觀看歷史視頻的鄰居視頻是協同過濾算法的關鍵步驟。其優點在于,不依賴用戶的屬性信息和視頻的內容信息,僅僅通過分析大量用戶對視頻的行為數據,從中找到特定的行為模式,據此來預測用戶的興趣并作出相關推薦。它不需要對視頻或者用戶進行嚴格的建模就可以作出令人滿意的推薦結果。基于內容的推薦算法是根據視頻的描述信息發現視頻之間的相關性,這是推薦系統出現之初應用最為廣泛的推薦機制,其核心思想在于利用視頻的描述信息發現視頻之間的相關性,然后基于用戶以往的喜好記錄推薦給用戶相似的視頻。其優點在于易于實現,不需要用戶數據因此不存在稀疏性和冷啟動問題,而且基于視頻本身的特征也不會出現過度推薦熱門的問題。
基于視頻的協同過濾的缺點有:①推薦效果依賴于用戶歷史偏好數據的多少和準確性;②用戶歷史和偏好是用稀疏矩陣進行存儲的,而且稀疏矩陣上的計算有明顯的問題,少部分人的錯誤偏好對準確度有較大的影響;③由于用戶和視頻的數量非常大,因此用戶-視頻矩陣的計算量會非常大,在實時推薦實現時難度也會較大。基于內容的相關推薦的缺點有:①視頻的描述信息會有缺失,導致無法提取視頻屬性;②抽取的視頻特征紀要保證準確性又要具有一定的實際意義,否則很難保證推薦結果的相關性。
上述缺陷同樣也出現在其他諸如音樂、新聞、商品的推薦過程中。
發明內容
本發明所要解決的技術問題是,提供一種內容推薦方法及內容推薦系統,不使用內容的描述信息或屬性,也不使用用戶的描述信息或屬性,即可實現內容的準確推薦。本發明是這樣實現的:
一種內容推薦方法,包括如下步驟:
步驟A:獲取所有用戶的內容查看歷史數據,每個用戶的內容查看歷史數據包括該用戶查看過的所有內容以及各內容的查看時間;
步驟B:按照查看時間先后順序分別對每個用戶查看過的所有內容進行排序,得到每個用戶的歷史查看內容序列;
步驟C:對每個用戶的歷史查看內容序列進行連續詞袋模型訓練,得到連續詞袋模型,從而得到每個內容的內容向量;
步驟D:獲取目標用戶在預設時間窗口內查看過的內容的集合;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳大學,未經深圳大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611177415.1/2.html,轉載請聲明來源鉆瓜專利網。
- 內容再現系統、內容提供方法、內容再現裝置、內容提供裝置、內容再現程序和內容提供程序
- 內容記錄系統、內容記錄方法、內容記錄設備和內容接收設備
- 內容服務系統、內容服務器、內容終端及內容服務方法
- 內容分發系統、內容分發裝置、內容再生終端及內容分發方法
- 內容發布、內容獲取的方法、內容發布裝置及內容傳播系統
- 內容提供裝置、內容提供方法、內容再現裝置、內容再現方法
- 內容傳輸設備、內容傳輸方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容發送設備、內容發送方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容再現裝置、內容再現方法、內容再現程序及內容提供系統
- 內容記錄裝置、內容編輯裝置、內容再生裝置、內容記錄方法、內容編輯方法、以及內容再生方法





