[發明專利]一種基于神經網絡的新聞推薦方法有效
| 申請號: | 202010431112.8 | 申請日: | 2020-05-20 |
| 公開(公告)號: | CN111639258B | 公開(公告)日: | 2023-09-22 |
| 發明(設計)人: | 羅軼鳳;朱鵬 | 申請(專利權)人: | 蘇州遐邇信息技術有限公司 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F16/9536;G06Q50/00;G06N3/0464;G06N3/08 |
| 代理公司: | 蘇州威世朋知識產權代理事務所(普通合伙) 32235 | 代理人: | 楊林潔 |
| 地址: | 215332 江蘇省蘇州市昆山*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 神經網絡 新聞 推薦 方法 | ||
本發明涉及一種基于神經網絡的新聞推薦方法,利用用戶之前點擊過的閱讀新聞信息和用戶的社交信息這兩部分信息進行用戶特征表示,當出現一個新的沒有閱讀過的新聞時,也就是候選新聞,新聞推薦方法根據用戶特征表示和候選新聞表示之間的相似性來考慮用戶是否單擊該候選新聞。本發明與現有技術相比具有為新聞的推薦工作提供了一個新的解決方案,方法簡便,效率高。
技術領域
本發明涉及網絡上信息推薦技術領域,尤其是涉及一種基于神經網絡的新聞推薦方法。
背景技術
隨著萬維網的廣泛普及,大量新聞正在迅速出現,并且信息嚴重超載,因此用戶別無選擇。新聞推薦的出現減輕了信息過載,并幫助用戶快速準確地獲取他們感興趣的新聞。當前,常用的推薦方法是基于內容的過濾(CB),協作過濾(CF)和混合方法。在新聞推薦領域,基于內容的推薦算法是基于對讀者過去感興趣的文檔進行分析,以推薦更多相關文檔。
有研究者提出了一種基于內容的模型和余弦相似度搜索的快速新聞推薦方法,盡管該算法具有很高的解釋性,并且沒有冷啟動的問題,但是在建議的多樣性方面不足,因此難以挖掘用戶的潛在偏好。與Google的新聞個性化系統類似,協作過濾取決于社區中的協作過濾和興趣模式,而不管新聞文章的內容如何。有研究者提出了一種自適應用戶分析模型,該模型將協作過濾應用于相似用戶組閱讀的新聞列表,并以傳統方式將新聞視為項目,協作過濾算法需要積累用戶的點擊行為來進行推薦,從而導致用戶冷啟動的問題。混合推薦算法主要采用基于內容和協同過濾的推薦算法,也有研究者提出了一種基于內容推薦和協同過濾的新聞推薦方法,該方法對傳統的基于內容的方法進行了改進,以獲得用戶的興趣,通過特征詞的協同過濾獲得用戶的潛在興趣,并將用戶的興趣與潛在的興趣相結合,從而獲得集成的用戶興趣模型,然后提出新聞建議。
混合推薦算法在一定程度上解決了基于內容的推薦多樣性的問題,但其準確性有待提高。一些研究表明,使用Twitter信息進行新聞推薦具有高度相關性。還有研究者研究了一種使用Twitter推薦實時時事的方法,其中用戶個人資料由文章組成,這是使用TF-IDF計算得出的術語。還有人提出將新聞與社交媒體上的信息(推文)結合起來以建立三種用戶個人資料,然后計算用戶與新聞文章之間的余弦相似度。
從以上研究可以發現,很少有學者研究過用戶的社交關系對新聞推薦的影響,而且大多數學者只關注單一屬性或者沒有被應用到新聞推薦中。
發明內容
本發明的目的是針對現有技術的不足而設計的一種基于神經網絡的新聞推薦方法,利用用戶的社交信息和用戶之前閱讀過的新聞信息進行推薦,用用戶的社交信息和之前閱讀過的新聞信息來對用戶進行最終表征,然后根據用戶的最終表征和候選新聞的最終表征之間的相似性來考慮用戶是否單擊候選新聞。
本發明解決其技術問題所采用的技術方案是:一種基于神經網絡的新聞推薦方法,該推薦方法的步驟為,
S1、獲取原有數據庫內部分的新聞信息及所有的用戶信息;
S2、利用FastText工具對獲取的新聞信息中的標題與內容進行學習,獲取固定長度的詞向量并組成相應的詞匯表;
S3、對數據庫內獲取的新聞信息按照不同的用戶信息進行人工標注,人工標注的標準為是否為該用戶已經閱讀的新聞信息,已經閱讀的新聞信息為閱讀新聞信息,未被閱讀的新聞信息為候選新聞信息;
S4、對獲取的不同用戶的閱讀新聞信息與候選新聞信息,利用開源工具對標題與內容進行分詞標注;
S5、將已經人工標注及分詞標注的新聞信息組成新聞數據集,將獲取的用戶信息組成用戶數據集,對新聞數據集及用戶數據集進行整理和預處理,得到訓練集與測試集,訓練集由閱讀新聞信息及用戶信息組成,測試集由候選新聞信息與用戶信息組成;
S6、利用步驟S5中訓練集進行訓練,得到新聞信息的推薦模型;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘇州遐邇信息技術有限公司,未經蘇州遐邇信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010431112.8/2.html,轉載請聲明來源鉆瓜專利網。





