[發(fā)明專利]融合微博興趣挖掘的新聞推送方法、裝置及設(shè)備在審
| 申請?zhí)枺?/td> | 201810966477.3 | 申請日: | 2018-08-23 |
| 公開(公告)號: | CN109325175A | 公開(公告)日: | 2019-02-12 |
| 發(fā)明(設(shè)計)人: | 張帥;陳靖宇;陳平華 | 申請(專利權(quán))人: | 廣東工業(yè)大學(xué) |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535 |
| 代理公司: | 北京集佳知識產(chǎn)權(quán)代理有限公司 11227 | 代理人: | 羅滿 |
| 地址: | 510006 廣東省*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 微博 用戶興趣 狀態(tài)文本 集合 興趣挖掘 文本 新聞文本 推送 融合 計算機可讀存儲介質(zhì) 個性化需求 裝置及設(shè)備 社交信息 社交應(yīng)用 推送裝置 用戶動態(tài) 用戶資料 冷啟動 相似度 緩解 主流 | ||
本發(fā)明公開了一種融合微博興趣挖掘的新聞推送方法,能根據(jù)新聞文本確定新聞詞項集合,根據(jù)微博狀態(tài)文本確定用戶興趣詞項集合,通過計算新聞詞項集合與用戶興趣詞項集合之間的相似度,決定是否將新聞文本推送給微博用戶。可見,該方法利用了微博這一主流社交應(yīng)用上存在豐富的用戶興趣的特點,根據(jù)微博狀態(tài)文本確定用戶興趣詞項集合,由于微博狀態(tài)文本至少包括用戶動態(tài)文本、用戶資料文本、以及社交信息文本,擴充了用于提取用戶興趣的文本,緩解了冷啟動問題,此外,微博狀態(tài)文本均反映的是微博用戶自身的興趣,更能滿足個性化需求。本發(fā)明還提供了一種融合微博興趣挖掘的新聞推送裝置、設(shè)備、及計算機可讀存儲介質(zhì),其作用與上述方法相對應(yīng)。
技術(shù)領(lǐng)域
本發(fā)明涉及興趣挖掘領(lǐng)域,特別涉及一種融合微博興趣挖掘的新聞推送方法、裝置、設(shè)備及計算機可讀存儲介質(zhì)。
背景技術(shù)
隨著互聯(lián)網(wǎng)的發(fā)展,信息爆炸使得新聞推薦成為推薦系統(tǒng)的熱點研究。傳統(tǒng)的新聞推薦方法主要包括以下三種方法:
基于內(nèi)容的新聞推薦,其主要思想是根據(jù)用戶自身的瀏覽記錄為用戶推薦新聞,其缺點是它對新聞特征的提取能力有限,存在著過度專門化的問題,在推薦多樣性上存在不足,難以發(fā)掘用戶潛在興趣。此外,其對用戶自身的瀏覽記錄的數(shù)量要一定要求,當(dāng)用戶自身的瀏覽記錄不夠多,該方法將難以為用戶推薦感興趣的新聞。
協(xié)同過濾新聞推薦,其主要思想是根據(jù)與用戶自身條件相似的人的興趣愛好為用戶推薦新聞,其缺點是難以滿足用戶的個性化需求。
基于知識(語義)的新聞推薦,其主要思想是根據(jù)專家評價為用戶推薦新聞,其缺點是不能滿足用戶的個性化需求,此外,其推薦效果對知識庫的依賴性較強,而專門領(lǐng)域的知識和推理規(guī)則通常較難獲取。
可見,傳統(tǒng)的新聞推薦方法存在著冷啟動問題、以及不能滿足用戶個性化需求的問題。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種融合微博興趣挖掘的新聞推送方法、裝置、設(shè)備及計算機可讀存儲介質(zhì),用以解決傳統(tǒng)的新聞推薦方法存在的冷啟動問題以及無法滿足用戶個性化需求的問題。
為解決上述技術(shù)問題,本發(fā)明提供了一種融合微博興趣挖掘的新聞推送方法,包括:
從新聞平臺獲取多條新聞文本,確定與所述新聞文本對應(yīng)的新聞詞項集合,其中,所述新聞詞項集合包括所述新聞文本中的新聞詞項,還包括所述新聞詞項的詞頻;
獲取微博用戶的微博狀態(tài)文本,確定與所述微博狀態(tài)文本對應(yīng)的用戶興趣詞項集合,其中,所述微博狀態(tài)文本至少包括用戶動態(tài)文本、用戶資料文本、以及社交信息文本,所述用戶興趣詞項集合包括所述微博狀態(tài)文本中的興趣詞項,還包括所述興趣詞項的詞頻;
計算所述新聞詞項集合與所述用戶興趣詞項集合的相似度;
判斷所述相似度是否大于預(yù)設(shè)閾值;
若大于,則將所述新聞文本推送給所述微博用戶。
其中,所述從新聞平臺獲取多條新聞文本,確定與所述新聞文本對應(yīng)的新聞詞項集合包括:
從新聞平臺獲取多條新聞文本,并對所述新聞文本進(jìn)行分類,得到多個新聞文本集合;
確定分別與所述新聞文本集合中各個新聞文本對應(yīng)的新聞詞項集合;
所述計算所述新聞詞項集合與所述用戶興趣詞項集合的相似度包括:
根據(jù)所述用戶興趣詞項集合,從各個所述新聞文本集合中篩選出所述微博用戶感興趣的新聞文本集合;
遍歷所述新聞文本集合中的各個新聞文本,計算所述新聞文本對應(yīng)的新聞詞項集合與所述用戶興趣詞項集合的相似度。
其中,所述新聞文本集合為通過textCNN分類技術(shù)進(jìn)行分類得到的。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣東工業(yè)大學(xué),未經(jīng)廣東工業(yè)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810966477.3/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 微博消息的發(fā)布方法、微博終端及微博服務(wù)器端
- 微博整合方法、微博終端、微博列表、微博話題服務(wù)器及系統(tǒng)
- 微博話題檢測方法及系統(tǒng)
- 微博排序、搜索、展示方法和系統(tǒng)
- 一種微博消息的發(fā)布方法及裝置、系統(tǒng)
- 一種收藏微博的方法和微博收藏服務(wù)系統(tǒng)
- 微博用戶影響力的評估方法
- 一種基于轉(zhuǎn)發(fā)評論的微博語義擴充模型和方法
- 基于微博主題進(jìn)行微博轉(zhuǎn)發(fā)路徑預(yù)測的方法和系統(tǒng)
- 基于微博主題標(biāo)簽進(jìn)行微博轉(zhuǎn)發(fā)預(yù)測的方法和系統(tǒng)
- SIP通信中針對文本消息的傳遞報告
- 數(shù)據(jù)庫的數(shù)據(jù)恢復(fù)方法及相關(guān)的設(shè)備
- 一種大文本的聯(lián)機交易處理方法及裝置
- 一種輸入預(yù)測方法及裝置
- 文本處理裝置、方法、設(shè)備以及計算機可讀存儲介質(zhì)
- 一種配電網(wǎng)設(shè)備的故障缺陷文本提取設(shè)備健康狀態(tài)方法
- 通信話務(wù)狀態(tài)的識別方法、系統(tǒng)、裝置及存儲介質(zhì)
- 跨任務(wù)文本情緒狀態(tài)評估方法、系統(tǒng)、裝置及介質(zhì)
- 一種基于有限狀態(tài)機的文本正則化方法及系統(tǒng)
- 圖文生成方法、裝置、計算機設(shè)備及存儲介質(zhì)





