[發(fā)明專利]一種網(wǎng)站文章自定義推薦方法在審
| 申請?zhí)枺?/td> | 202011578123.5 | 申請日: | 2020-12-28 |
| 公開(公告)號(hào): | CN112579908A | 公開(公告)日: | 2021-03-30 |
| 發(fā)明(設(shè)計(jì))人: | 劉青;連恩楊;李朋;李文靜;沈洪月;張漢勇 | 申請(專利權(quán))人: | 濟(jì)南大象信息技術(shù)有限公司 |
| 主分類號(hào): | G06F16/9535 | 分類號(hào): | G06F16/9535;G06F40/284;G06F16/22;G06F16/28 |
| 代理公司: | 濟(jì)南格源知識(shí)產(chǎn)權(quán)代理有限公司 37306 | 代理人: | 韓洪淼 |
| 地址: | 250102 山東省濟(jì)南市*** | 國省代碼: | 山東;37 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 網(wǎng)站 文章 自定義 推薦 方法 | ||
1.一種網(wǎng)站文章自定義推薦方法,其特征在于,包括:
對文章的內(nèi)容進(jìn)行分詞并提取標(biāo)簽詞組;
通過詞頻逆文檔頻率算法計(jì)算文章標(biāo)簽向量;
通過計(jì)算余弦相似度進(jìn)行文章在線推薦;
使用協(xié)同過濾算法計(jì)算文章興趣度,并進(jìn)行離線推薦。
2.根據(jù)權(quán)利要求1所述的網(wǎng)站文章自定義推薦方法,其特征在于,所述對文章的內(nèi)容進(jìn)行分詞并提取標(biāo)簽詞組,包括:
對文章的內(nèi)容進(jìn)行分詞;
將去除無用詞條后的剩余詞條作為文章的標(biāo)簽詞條。
3.根據(jù)權(quán)利要求2所述的網(wǎng)站文章自定義推薦方法,其特征在于,所述通過詞頻逆文檔頻率算法計(jì)算文章標(biāo)簽向量,包括:
計(jì)算詞頻,公式為
計(jì)算逆向文件頻率,公式為
計(jì)算TFIDFw=TFw*IDFw,得到關(guān)鍵詞條;
將標(biāo)簽詞條的詞條量設(shè)為標(biāo)簽向量維度;
將標(biāo)簽詞條之外的新的標(biāo)簽向量的值設(shè)為0;
輸出文章標(biāo)簽向量:vec_a=[0.001,...0.002,..,0],其中a代表文章a。
4.根據(jù)權(quán)利要求3所述的網(wǎng)站文章自定義推薦方法,其特征在于,所述通過計(jì)算余弦相似度進(jìn)行文章在線推薦,包括:
通過文章標(biāo)簽向量計(jì)算余弦相似度,公式為其中a,b分別代表進(jìn)行計(jì)算的兩篇文章;
根據(jù)余弦相似度匹配當(dāng)前文章的相關(guān)文章,并過濾掉標(biāo)題相似的相關(guān)文章,得到在線推薦文章;
在線推薦文章按照所述相似度排序,在用戶點(diǎn)擊刷新或者重新打開網(wǎng)站時(shí)優(yōu)先展示在線推薦文章。
5.根據(jù)權(quán)利要求1所述的網(wǎng)站文章自定義推薦方法,其特征在于,所述使用協(xié)同過濾算法計(jì)算文章興趣度,并進(jìn)行離線推薦,包括:
利用余弦相似度計(jì)算用戶兩兩之間的用戶相似度;
公式為:μ,υ為兩個(gè)不同的用戶;
使用協(xié)同過濾算法將相近興趣的用戶分在一組;
為任一用戶共享推薦組內(nèi)成員看過的文章。
6.根據(jù)權(quán)利要求5所述的網(wǎng)站文章自定義推薦方法,其特征在于,所述方法還包括:
篩選與當(dāng)前用戶的用戶相似度匹配較高的若干個(gè)用戶;
獲取所述若干個(gè)用戶閱讀過的離線推薦文章,并過濾掉當(dāng)前用戶閱讀過的文章;
將離線推薦文章按照用戶相似度加權(quán)求和之后排序,并在用戶隔天登錄時(shí)優(yōu)先展示。
7.根據(jù)權(quán)利要求1所述的網(wǎng)站文章自定義推薦方法,其特征在于,所述方法還包括:
文章內(nèi)容存儲(chǔ)到mysql數(shù)據(jù)庫,并設(shè)置文章ID為索引;
記錄用戶閱讀日志并存儲(chǔ)到kafka數(shù)據(jù)庫,所述閱讀日志包括:用戶ID和文章ID和閱讀時(shí)間。
8.根據(jù)權(quán)利要求1所述的網(wǎng)站文章自定義推薦方法,其特征在于,所述方法還包括:
網(wǎng)站按照文章大類進(jìn)行文章展示,設(shè)置類別ID表示文章類別。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于濟(jì)南大象信息技術(shù)有限公司,未經(jīng)濟(jì)南大象信息技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011578123.5/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 與HTTP網(wǎng)站關(guān)聯(lián)的WAP網(wǎng)站
- 基于網(wǎng)站指紋推送白名單的方法及系統(tǒng)
- 網(wǎng)站漏洞檢測方法和系統(tǒng)
- 一種網(wǎng)站建立方法、裝置及計(jì)算設(shè)備
- 一種網(wǎng)站識(shí)別方法及裝置
- 網(wǎng)站風(fēng)險(xiǎn)評估方法及裝置
- 網(wǎng)站版權(quán)時(shí)間的管理方法、裝置、存儲(chǔ)介質(zhì)及設(shè)備
- 一種網(wǎng)站開發(fā)系統(tǒng)及方法
- 一種基于網(wǎng)站地圖的指紋識(shí)別方法
- 網(wǎng)站應(yīng)用框架指紋識(shí)別的方法、設(shè)備、裝置及介質(zhì)





