[發明專利]一種基于互聯網用戶行為的服務推薦方法有效
| 申請號: | 202010588883.8 | 申請日: | 2020-06-24 |
| 公開(公告)號: | CN111753151B | 公開(公告)日: | 2023-09-15 |
| 發明(設計)人: | 曾偉英;陳昌明;霍智杰 | 申請(專利權)人: | 廣東科杰通信息科技有限公司 |
| 主分類號: | G06F16/9032 | 分類號: | G06F16/9032;G06F16/906;G06F16/951;G06F16/9535;G06F40/247;G06F40/284;H04L67/55 |
| 代理公司: | 佛山市禾才知識產權代理有限公司 44379 | 代理人: | 劉羽波;梁永健 |
| 地址: | 528000 廣東省*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 互聯網 用戶 行為 服務 推薦 方法 | ||
1.一種基于互聯網用戶行為的服務推薦方法,其特征在于:具體步驟如下:
步驟A:建立網絡爬蟲爬取IP瀏覽文章的歷史數據,并對全量的文章提取關鍵字標簽,將所有標簽作為元素進入Apriori模型生成關聯事務;
在步驟A中,具體包括:
步驟A1:根據埋點數據,獲取不同IP地址點擊過的文章標題;
步驟A2:利用請求接口對根據文章標題構建成的url進行請求,返回jsonp格式數據體;
步驟A3:對jsonp格式數據體進行解析,獲取其中的標題對應的文章內容;
步驟A4:對IP的閱讀歷史進行聚合,同時對所有文章內容進行關鍵詞提取,使關鍵詞聚合到IP上,形成每個IP的標簽;
步驟A5:將IP及其標簽放到Apriori模型中進行擬合,獲取所有關鍵詞的關聯事務;
步驟B:制作數據隊列,對新用戶的搜素關鍵詞和點擊瀏覽文章進行采集存儲;
步驟C:對爬取的全量文章詞匯進行word2vec提取,從用戶的行為軌跡文本中匹配近似近義詞匯,作為新用戶的文本標簽;
在步驟C中,具體包括:
步驟C1:對文本進行分詞處理;
步驟C2:去除文本中的停用詞;
步驟C3:以文章作為向量形成文本矩陣,進行word2vec處理;
步驟C4:對所有經過word2vec處理訓練的文章內的詞匯進行向量嵌入之后,通過求解詞向量的余弦相似度,從步驟A中關聯起來的關鍵詞中匹配近義詞;
步驟D:將新用戶的文本標簽通過步驟A中生成的關聯事務關聯起來,形成新的用戶文本標簽,根據新的用戶文本標簽進行文章推薦;
在步驟D中,具體包括:
步驟D1:提取當前用戶的文本標簽,對文本隊列進行文本處理,去除停用詞和進行分詞處理;
步驟D2:計算詞頻權重,通過結合歷史閱讀的文章文本,計算文本隊列中詞匯的tfidf權重;
步驟D3:對整個文本隊列進行時效性修正,包括將所有隊列中的文本乘以修正值,所述修正值的取值范圍為(0,1),文本隊列中越靠前的詞匯的修正值越??;
步驟D4:將經過步驟D2和D3加權之后取權重最大的若干詞匯,來更新用戶的文本標簽;
步驟D5:將步驟D4中更新的用戶的文本標簽,執行步驟C求取近義詞,再通過步驟A生成關聯事務進行關聯,返回的新的文本標簽及其近義詞為新的用戶文本標簽;
步驟D6:以步驟D5中新的用戶文本標簽作為推薦文章的關鍵詞進行推薦。
2.根據權利要求1所述一種基于互聯網用戶行為的服務推薦方法,其特征在于:
在步驟B中,具體包括:
步驟B1:通過埋點采集IP對應搜索引擎的關鍵字;
步驟B2:將采集的關鍵字形成文本隊列。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣東科杰通信息科技有限公司,未經廣東科杰通信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010588883.8/1.html,轉載請聲明來源鉆瓜專利網。





