[發(fā)明專(zhuān)利]一種網(wǎng)站文章自定義推薦方法在審
| 申請(qǐng)?zhí)枺?/td> | 202011578123.5 | 申請(qǐng)日: | 2020-12-28 |
| 公開(kāi)(公告)號(hào): | CN112579908A | 公開(kāi)(公告)日: | 2021-03-30 |
| 發(fā)明(設(shè)計(jì))人: | 劉青;連恩楊;李朋;李文靜;沈洪月;張漢勇 | 申請(qǐng)(專(zhuān)利權(quán))人: | 濟(jì)南大象信息技術(shù)有限公司 |
| 主分類(lèi)號(hào): | G06F16/9535 | 分類(lèi)號(hào): | G06F16/9535;G06F40/284;G06F16/22;G06F16/28 |
| 代理公司: | 濟(jì)南格源知識(shí)產(chǎn)權(quán)代理有限公司 37306 | 代理人: | 韓洪淼 |
| 地址: | 250102 山東省濟(jì)南市*** | 國(guó)省代碼: | 山東;37 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 網(wǎng)站 文章 自定義 推薦 方法 | ||
本發(fā)明提供一種網(wǎng)站文章自定義推薦方法,包括:對(duì)文章的內(nèi)容進(jìn)行分詞并提取標(biāo)簽詞組;通過(guò)詞頻逆文檔頻率算法計(jì)算文章標(biāo)簽向量;通過(guò)計(jì)算余弦相似度進(jìn)行文章在線推薦;使用協(xié)同過(guò)濾算法計(jì)算文章興趣度,并進(jìn)行離線推薦。本發(fā)明實(shí)現(xiàn)了用戶瀏覽文章之后,通過(guò)閱讀日志的分析,為用戶推薦感興趣的文章。
技術(shù)領(lǐng)域
本發(fā)明屬于網(wǎng)站應(yīng)用技術(shù)領(lǐng)域,具體涉及一種網(wǎng)站文章自定義推薦方法。
背景技術(shù)
隨著人們對(duì)于碎片化時(shí)間的重視,市場(chǎng)上有關(guān)文章、博文、新聞的網(wǎng)站和手機(jī)應(yīng)用層出不窮。傳統(tǒng)的新聞?lì)惥W(wǎng)站,文章一般按照時(shí)間順序展示,每個(gè)用戶看到的是相同的文章列表,導(dǎo)致用戶體驗(yàn)度不高,為擺脫傳統(tǒng)的編輯推薦模式,通過(guò)個(gè)性化推薦算法,給用戶展示個(gè)性化文章成為主流,也能為開(kāi)發(fā)商帶來(lái)一定的收益。
現(xiàn)在很多文章閱讀網(wǎng)站已經(jīng)使用了個(gè)性化推薦,一般通過(guò)收集用戶的瀏覽日志,完成個(gè)性化推薦;但是由于網(wǎng)站的文章種類(lèi)繁多,標(biāo)題黨文章橫行,導(dǎo)致用戶點(diǎn)開(kāi)的文章可能不是因?yàn)樗信d趣,而是被標(biāo)題吸引。此外,進(jìn)行推薦的時(shí)候,由于系統(tǒng)掉線或者刷新會(huì)存在推薦滯后。
發(fā)明內(nèi)容
針對(duì)現(xiàn)有技術(shù)的上述不足,本發(fā)明提供一種網(wǎng)站文章自定義推薦方法,以解決上述技術(shù)問(wèn)題。
本發(fā)明提供一種網(wǎng)站文章自定義推薦方法,包括:
對(duì)文章的內(nèi)容進(jìn)行分詞并提取標(biāo)簽詞組;
通過(guò)詞頻逆文檔頻率算法計(jì)算文章標(biāo)簽向量;
通過(guò)計(jì)算余弦相似度進(jìn)行文章在線推薦;
使用協(xié)同過(guò)濾算法計(jì)算文章興趣度,并進(jìn)行離線推薦。
進(jìn)一步的,所述對(duì)文章的內(nèi)容進(jìn)行分詞并提取標(biāo)簽詞組,包括:
對(duì)文章的內(nèi)容進(jìn)行分詞;
將去除無(wú)用詞條后的剩余詞條作為文章的標(biāo)簽詞條。
進(jìn)一步的,所述通過(guò)詞頻逆文檔頻率算法計(jì)算文章標(biāo)簽向量,包括:
計(jì)算詞頻,公式為
計(jì)算逆向文件頻率,公式為
計(jì)算TFIDFw=TFw*IDFw,得到關(guān)鍵詞條;
將標(biāo)簽詞條的詞條量設(shè)為標(biāo)簽向量維度;
將標(biāo)簽詞條之外的新的標(biāo)簽向量的值設(shè)為0;
輸出文章標(biāo)簽向量:vec_a=[0.001,...0.002,..,0],其中a代表文章a。
進(jìn)一步的,所述通過(guò)計(jì)算余弦相似度進(jìn)行文章在線推薦,包括:
通過(guò)文章標(biāo)簽向量計(jì)算余弦相似度,公式為其中a,b分別代表進(jìn)行計(jì)算的兩篇文章;
根據(jù)余弦相似度匹配當(dāng)前文章的相關(guān)文章,并過(guò)濾掉標(biāo)題相似的相關(guān)文章,得到在線推薦文章;
在線推薦文章按照所述相似度排序,在用戶點(diǎn)擊刷新或者重新打開(kāi)網(wǎng)站時(shí)優(yōu)先展示在線推薦文章。
進(jìn)一步的,所述使用協(xié)同過(guò)濾算法計(jì)算文章興趣度,并進(jìn)行離線推薦,包括:
利用余弦相似度計(jì)算用戶兩兩之間的用戶相似度;
公式為:μ,υ為兩個(gè)不同的用戶;
使用協(xié)同過(guò)濾算法將相近興趣的用戶分在一組;
為任一用戶共享推薦組內(nèi)成員看過(guò)的文章。
進(jìn)一步的,所述方法還包括:
篩選與當(dāng)前用戶的用戶相似度匹配較高的若干個(gè)用戶;
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于濟(jì)南大象信息技術(shù)有限公司,未經(jīng)濟(jì)南大象信息技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011578123.5/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 與HTTP網(wǎng)站關(guān)聯(lián)的WAP網(wǎng)站
- 基于網(wǎng)站指紋推送白名單的方法及系統(tǒng)
- 網(wǎng)站漏洞檢測(cè)方法和系統(tǒng)
- 一種網(wǎng)站建立方法、裝置及計(jì)算設(shè)備
- 一種網(wǎng)站識(shí)別方法及裝置
- 網(wǎng)站風(fēng)險(xiǎn)評(píng)估方法及裝置
- 網(wǎng)站版權(quán)時(shí)間的管理方法、裝置、存儲(chǔ)介質(zhì)及設(shè)備
- 一種網(wǎng)站開(kāi)發(fā)系統(tǒng)及方法
- 一種基于網(wǎng)站地圖的指紋識(shí)別方法
- 網(wǎng)站應(yīng)用框架指紋識(shí)別的方法、設(shè)備、裝置及介質(zhì)
- 一種自定義命令控制方法、裝置及注塑機(jī)系統(tǒng)
- 一種公式自定義方法及使用自定義公式的方法
- 一種報(bào)表系統(tǒng)自定義函數(shù)的實(shí)現(xiàn)方法
- 用于混淆虛擬機(jī)上的應(yīng)用程序的執(zhí)行的方法、裝置以及計(jì)算機(jī)可讀介質(zhì)
- 一種自定義腳本繪制終端及方法
- 添加自定義分詞的方法及裝置
- 用戶配置的且自定義的交互式對(duì)話應(yīng)用
- 一種應(yīng)用于晾衣機(jī)的自定義遙控系統(tǒng)及其設(shè)置方法
- 一種自定義住房單元
- 一種自定義文檔頁(yè)面生成方法及相關(guān)設(shè)備





