[發(fā)明專利]一種用于解決數(shù)據(jù)稀疏的新聞推薦方法有效
| 申請?zhí)枺?/td> | 201810624042.0 | 申請日: | 2018-06-15 |
| 公開(公告)號: | CN108876457B | 公開(公告)日: | 2021-05-18 |
| 發(fā)明(設(shè)計)人: | 張曉瑜 | 申請(專利權(quán))人: | 贛州柏朗科技有限公司 |
| 主分類號: | G06Q30/02 | 分類號: | G06Q30/02;G06F16/9535 |
| 代理公司: | 南昌金軒知識產(chǎn)權(quán)代理有限公司 36129 | 代理人: | 石紅麗 |
| 地址: | 341000 江西省贛州市贛州經(jīng)濟*** | 國省代碼: | 江西;36 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 用于 解決 數(shù)據(jù) 稀疏 新聞 推薦 方法 | ||
本發(fā)明請求保護一種用于解決數(shù)據(jù)稀疏的新聞推薦方法,其包括以下步驟:接收播報新聞的語音請求,對所述語音請求的用戶歷史行為數(shù)據(jù)進行篩選,得到新聞收聽用戶—新聞播報評分矩陣,基于篩選結(jié)果從預(yù)設(shè)用戶屬性項集合中確定出與所述語音請求關(guān)聯(lián)的目標屬性項;并為每個新聞收聽用戶和每個新聞播報端構(gòu)建歷史評分記錄集合,同時構(gòu)建用戶集合,按照用戶的評分新聞播報端數(shù)從大到小對用戶集合中的用戶排序;構(gòu)造最終的相似用戶集,利用目標用戶的相似用戶集對新聞收聽用戶—新聞播報評分矩陣進行填充;對評分矩陣中剩下的未填充數(shù)據(jù),利用相似新聞播報端來對再次填充,進行新聞播報端初步推薦;篩選出目標新聞進行推薦。本發(fā)明可以提高新聞推薦準確性。
技術(shù)領(lǐng)域
本發(fā)明屬于推薦技術(shù)領(lǐng)域,具體屬于一種用于解決數(shù)據(jù)稀疏的新聞推薦方法。
背景技術(shù)
隨著計算機技術(shù)的發(fā)展和網(wǎng)絡(luò)數(shù)據(jù)的不斷積累,人工智能技術(shù)飛速發(fā)展。用于為用戶提供新聞服務(wù)的新聞推薦方法,是利用電子設(shè)備主動向用戶推薦新聞的方法,是一種可以簡化用戶獲取新聞的操作、提升用戶獲取新聞的效率的信息處理方式。不同的用戶對新聞資訊的訴求、偏好具有差異。在傳統(tǒng)的新聞推薦方法中篩選為用戶推薦的新聞時,通常會考慮新聞的時效性和新聞內(nèi)容的質(zhì)量,對不同的用戶輸出相同的推薦結(jié)果,因此導(dǎo)致不同的人群對推薦結(jié)果不滿意,最常見的是協(xié)同過濾算法。在新聞推薦領(lǐng)域,由于網(wǎng)站上的新聞數(shù)量巨大,但只有很少的用戶愿意給去過的新聞播放端評分,所以造成了新聞收聽用戶—新聞播報評分矩陣的極大稀疏,導(dǎo)致基于協(xié)同過濾算法得到的商家推薦列表不夠準確。
發(fā)明內(nèi)容
本發(fā)明旨在解決以上現(xiàn)有技術(shù)的問題。提出了一種提高矩陣稀疏度的用于解決數(shù)據(jù)稀疏的新聞推薦方法。
本發(fā)明的技術(shù)方案如下:
一種用于解決數(shù)據(jù)稀疏的新聞推薦方法,其包括以下步驟:
接收播報新聞的語音請求,對所述語音請求的用戶歷史行為數(shù)據(jù)進行篩選,獲取與新聞播報端及新聞收聽用戶相關(guān)的信息,得到新聞收聽用戶—新聞播報評分矩陣,基于篩選結(jié)果從預(yù)設(shè)用戶屬性項集合中確定出與所述語音請求關(guān)聯(lián)的目標屬性項;并利用建立的新聞收聽用戶—新聞播報評分矩陣,為每個新聞收聽用戶和每個新聞播報端構(gòu)建歷史評分記錄集合,同時構(gòu)建用戶集合,按照用戶的評分新聞播報端數(shù)從大到小對用戶集合中的用戶排序;按用戶在用戶集合中的順序,選取一個評分最高的用戶作為目標用戶;根據(jù)新聞收聽用戶—新聞播報評分矩陣,計算其余用戶與目標用戶的相似度;選取與目標用戶相似度大于第一設(shè)定值的用戶構(gòu)建目標用戶的優(yōu)先用戶集;計算目標用戶與各優(yōu)先用戶的歷史共同評分差均值,若兩個用戶歷史本身沒有共同新聞播報端,則不做計算;選取共同評分差均值小于第二設(shè)定值的用戶構(gòu)造最終的相似用戶集,利用目標用戶的相似用戶集對新聞收聽用戶—新聞播報評分矩陣進行填充;對評分矩陣中剩下的未填充數(shù)據(jù),同樣采用相似度閾值法和共同評分差均值來選取最相似新聞播報端,并利用相似新聞播報端來對新聞收聽用戶—新聞播報評分矩陣進行再次填充,進行新聞播報端初步推薦;并獲取所述目標用戶屬性項對應(yīng)的用戶屬性信息;基于用戶屬性信息在待推薦新聞播報端中篩選出目標新聞進行推薦,若和初步推薦結(jié)果一樣則按此推薦,若不一樣則選取用戶的評分新聞播報端數(shù)第二高評分數(shù)作為目標用戶,重復(fù)以上步驟進行填充,得到推薦新聞播報端,播報該新聞播報端。
進一步的,所述構(gòu)建目標用戶的優(yōu)先用戶集過程如下:
按用戶在用戶集合中的順序,選取一個評分最高的用戶作為目標用戶;利用新聞收聽用戶—新聞播報評分矩陣,通過Pearson皮爾遜相關(guān)系數(shù)公式來計算其余用戶與目標用戶的相似度;
其中,simu,v表示用戶u和用戶v的相似度,Iu,v為用戶u和用戶v的共同評分商家集合,Rui、Rvi分別為用戶u、用戶v對商家i的評分,Ru、Rv分別為用戶u、用戶v的平均評分;選取與目標用戶相似度大于α的用戶構(gòu)建目標用戶的優(yōu)選鄰居用戶集p_N(u)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于贛州柏朗科技有限公司,未經(jīng)贛州柏朗科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810624042.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





