[發明專利]用于推薦文章的方法、設備和電子設備有效
| 申請號: | 201710828184.4 | 申請日: | 2017-09-14 |
| 公開(公告)號: | CN107562925B | 公開(公告)日: | 2020-10-13 |
| 發明(設計)人: | 康昭委 | 申請(專利權)人: | 阿里巴巴(中國)有限公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F40/279 |
| 代理公司: | 北京博雅睿泉專利代理事務所(特殊普通合伙) 11442 | 代理人: | 楊國權;馬佑平 |
| 地址: | 310051 浙江省杭州市濱江*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 推薦 文章 方法 設備 電子設備 | ||
本發明公開了一種用于推薦文章的方法、設備和電子設備。該方法包括:獲取與多個對象對應的多個文章的特征詞;基于所述特征詞訓練神經網絡,以得到分布式表示的特征向量和經訓練的神經網絡;獲取對象特征詞,其中,所述對象特征詞是與要向其推薦文章的對象相關的文章的特征詞;獲取所述對象特征詞對應的特征向量作為輸入特征向量;將所述輸入特征向量輸入所述神經網絡以得到輸出向量;獲取與所述輸出向量最接近的至少一個特征向量作為推薦特征向量;以及輸出與所述推薦特征向量對應的文章做推薦文章。根據一個實施例,提供一種新的推薦文章的方式。
技術領域
本發明涉及文章推薦技術,更具體地,涉及一種用于推薦文章的方法、設備和電子設備。
背景技術
隨著信息網絡技術的發展,如何提高媒體對用戶的粘性,這日益成為各個內容提供商關注的技術問題。提高用戶粘性的一個很重要的手段是向用戶推薦他感興趣的文章,諸如,小說、新聞、網絡博客等。如何確定確定用戶感興趣的文章以向用戶推薦該文章,這是許多技術人員研究的一種重要方面。
下面,以諸如網絡小說的小說為例,說明目前用于推薦文章的現有技術。通常可以兩種方式來確定向用戶推薦的小說。
第一種是協同過濾算法方式。目前,協同過濾算法方式是應用最廣泛的推薦小說的方式。該方式的基本思想是,如果a、b兩本小說經常被不同的讀者同時閱讀的話,那么當一個讀者閱讀小說a的時候,可以向他推薦小說b。
在現有技術中,通常將這種協同過濾方式分為所謂的離線部分和在線部分。離線部分用于統計小說和小說之間的相似性。在線部分用于確定所要推薦的小說。
在離線部分中,通過所收集的用戶打點數據,統計小說與小說之間的相似性。例如,小說之間的相似性可以是基于閱讀歷史數據的。例如,可以通過如下公司計算相似性simi,j:
N(i)是指小說i的讀者列表集合,N(j)是指小說j的讀者列表集合。
上述公式可以進一步被改進。例如,相似性simi,j還可以被表示為:
其中,ru,i表示讀者u對于小說i的喜愛程度。
在在線部分中,使用用戶的在線部分,使用用戶的閱讀歷史和在離線部分中計算的小說的相似性simi,j計算出推薦書籍su,j:
其中,Wu,i是用戶u對閱讀過的小說i的喜愛程度,例如,可以基于閱讀頻次確定。Simi,j是在離線部分中計算出的小說之間的相似性。可以基于su,j向用戶推薦小說。
這種方式的泛化能力較差。
第二種是基于話題的隱語義模型方式。基于矩陣理論,一個矩陣可以分解為兩個矩陣相乘。在小說推薦技術領域,原始矩陣是用戶和小說之間的關系R。R可以表示如下:
其中,P是用戶和小說類別之間的關系,Q是小說和小說類別之間的關系。
可以通過閱讀歷史獲得原始矩陣。在某些情況下,原始矩陣中的某些元素可能沒有值。這些沒有值的元素是在推薦過程中需要求解的值。可以通過隨機梯度下降法或奇異值分解(SVD)法對上述矩陣進行求解。可以基于所求解的值確定應該向各個用戶推薦哪本小說(例如,相應用戶對應的行中,值較高的小說)。
在這種方式中,由于原始矩陣存在大量未知的元素,即,用戶在很多小說上沒有行為(閱讀行為等),因此,這種方式的準確性低。
因此,需要提供一種新的技術方案,針對上述現有技術中的至少一個技術問題進行改進。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于阿里巴巴(中國)有限公司,未經阿里巴巴(中國)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710828184.4/2.html,轉載請聲明來源鉆瓜專利網。





