[發明專利]一種基于互聯網用戶行為的服務推薦方法有效
| 申請號: | 202010588883.8 | 申請日: | 2020-06-24 |
| 公開(公告)號: | CN111753151B | 公開(公告)日: | 2023-09-15 |
| 發明(設計)人: | 曾偉英;陳昌明;霍智杰 | 申請(專利權)人: | 廣東科杰通信息科技有限公司 |
| 主分類號: | G06F16/9032 | 分類號: | G06F16/9032;G06F16/906;G06F16/951;G06F16/9535;G06F40/247;G06F40/284;H04L67/55 |
| 代理公司: | 佛山市禾才知識產權代理有限公司 44379 | 代理人: | 劉羽波;梁永健 |
| 地址: | 528000 廣東省*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 互聯網 用戶 行為 服務 推薦 方法 | ||
一種基于互聯網用戶行為的服務推薦方法,具體步驟如下:步驟A:建立網絡爬蟲爬取IP瀏覽文章的歷史數據,并對全量的文章提取關鍵字標簽,將所有標簽作為元素進入Apriori模型生成關聯事務;步驟B:制作數據隊列,對新用戶的搜素關鍵詞和點擊瀏覽文章進行采集存儲;步驟C:對爬取的全量文章詞匯進行word2vec提取,從用戶的行為軌跡文本中匹配近似近義詞匯,作為新用戶的文本標簽;步驟D:將新用戶的文本標簽通過步驟A中生成的關聯事務關聯起來,形成新的用戶文本標簽,根據新的用戶文本標簽進行文章推薦。
技術領域
本發明涉及智能推薦技術領域,尤其涉及一種基于互聯網用戶行為的服務推薦方法。
背景技術
目前的文章推薦方法主要有兩種,一種是根據人工規則篩選出文章并進行推薦,例如:將熱點新聞或者整體點擊率更高的非個性化的文章推薦給用戶,但是根據人工規則向用戶推薦的文章不具備個性化,導致文章點擊率下跌,故存在第二種方法,根據用戶歷史行為推薦文章,但是該方法,雖然優于第一種,但是卻只能向用戶推薦與歷史行為中存在的偏好相關的文章,難以向用戶推薦與歷史行為中不存在的偏好相關的文章,導致無法推薦用戶潛在興趣但不熟悉的文章,因此無法挖掘用戶的潛在興趣從而降低推薦效率。
發明內容
本發明的目的在于針對背景技術中的缺陷,提出一種基于互聯網用戶行為的服務推薦方法,通過對用戶關注信息的主題的關聯關系進行建立,同時提升對于用戶搜索文本的辨識能力,利用爬蟲對特定IP歷史瀏覽的文章文本數據進行爬取,建立接口獲取用戶的搜索痕跡,并使其具有時效性,實現文章推薦的效果。
為達此目的,本發明采用以下技術方案:
一種基于互聯網用戶行為的服務推薦方法,具體步驟如下:
步驟A:建立網絡爬蟲爬取IP瀏覽文章的歷史數據,并對全量的文章提取關鍵字標簽,將所有標簽作為元素進入Apriori模型生成關聯事務;
步驟B:制作數據隊列,對新用戶的搜素關鍵詞和點擊瀏覽文章進行采集存儲;
步驟C:對爬取的全量文章詞匯進行word2vec提取,從用戶的行為軌跡文本中匹配近似近義詞匯,作為新用戶的文本標簽;
步驟D:將新用戶的文本標簽通過步驟A中生成的關聯事務關聯起來,形成新的用戶文本標簽,根據新的用戶文本標簽進行文章推薦。
優選的,在步驟A中,具體包括:
步驟A1:根據埋點數據,獲取不同IP地址點擊過的文章標題;
步驟A2:利用請求接口對根據文章標題構建成的url進行請求,返回jsonp格式數據體;
步驟A3:對jsonp格式數據體進行解析,獲取其中的標題對應的文章內容;
步驟A4:對IP的閱讀歷史進行聚合,同時對所有文章內容進行關鍵詞提取,使關鍵詞聚合到IP上,形成每個IP的標簽;
步驟A5:將IP及其標簽放到Apriori模型中進行擬合,獲取所有關鍵詞的關聯事務。
優選的,在步驟B中,具體包括:
步驟B1:通過埋點采集IP對應搜索引擎的關鍵字;
步驟B2:將采集的關鍵字形成文本隊列。
優選的,在步驟C中,具體包括:
步驟C1:對文本進行分詞處理;
步驟C2:去除文本中的停用詞;
步驟C3:以文章作為向量形成文本矩陣,進行word2vec處理;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣東科杰通信息科技有限公司,未經廣東科杰通信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010588883.8/2.html,轉載請聲明來源鉆瓜專利網。





