[發明專利]一種基于話題識別的物品信息推送方法、系統及存儲介質在審
| 申請號: | 202110023421.6 | 申請日: | 2021-01-08 |
| 公開(公告)號: | CN112765459A | 公開(公告)日: | 2021-05-07 |
| 發明(設計)人: | 張凱;周建設;王偉麗;劉杰;冀俊宇 | 申請(專利權)人: | 首都師范大學 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F16/33;G06F40/284 |
| 代理公司: | 北京清控智云知識產權代理事務所(特殊普通合伙) 11919 | 代理人: | 管士濤 |
| 地址: | 100089 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 話題 識別 物品 信息 推送 方法 系統 存儲 介質 | ||
本申請的技術方案采用話題識別算法獲取新的網絡話題集合New,并且將其與用戶的個人習慣進行比對,如果該話題是用戶感興趣的內容,則將新話題相關的購物信息推送給用戶,這樣,用戶就可以獲得與時下熱門話題相關且用戶也關心該話題的購物信息,極大的提高了用戶的購物體驗度。
技術領域
本申請涉及購物推送技術領域,具體而言,涉及一種基于話題識別的物品信息推送方法、系統及存儲介質。
背景技術
隨著當今電子商務迅猛發展,用戶購買商品時選擇的渠道越來越多,網絡購物在現今人們的生活中占有越來越大分量,幾乎涵蓋了所有人群。然而,傳統的網絡購物通常是用戶根據自身的需求輸入相關的搜索信息進行搜索,這種方式難以滿足用戶的使用需求;現在也有一些購物網站可以基于用戶的購買習慣來針對性的進行購物信息的推送,然而,這種推送方式會局限于用戶的使用習慣,久之會導致用戶只能收到特定領域的購物信息,推送內容豐富程度上難以滿足用戶的使用需求。
如何能夠實現既自動向用戶推送購物信息,又可以保障推送消息不陷入特定領域即保證其豐富度,是目前亟需解決的技術問題。
發明內容
針對上述技術問題,本申請提供了一種基于話題識別的物品信息推送方法、系統及存儲介質。
本申請的第一方面提供了一種基于話題識別的物品信息推送方法,所述方法包括:
S1,基于用戶的注冊信息及使用習慣給用戶畫像,確定出用戶關注的話題集合U;
S2,基于話題識別算法獲取新的網絡話題集合New;
S3,逐一計算所述集合U與所述集合New中的各話題的相似度;
S4,若所述集合New中的話題與所述集合U中的任一話題相似度大于閾值,則向用戶推送與所述集合New中的所述話題對應的購物信息。
優選地,所述步驟S2具體包括如下步驟:
S21,實時采集不同類別的網絡文檔;
S22,先對每篇所述網絡文檔進行預料分詞,然后保留有實際意義的分詞,篩除停用詞和單個字,所述有實際意義的分詞包括名詞、動詞、形容詞;然后,再從保留的分詞中選擇特征詞構建話題模型,并計算特征詞權重,其中,所述特征詞包括關鍵詞元和普通特征詞;
S23,基于步驟S22獲得的數據計算文檔S與歷史話題的相似度,如果該文檔與歷史話題相似度小于預設值,則使用文檔S建立一個新話題,直至完成所有網絡文檔的相似度計算,構建出新的網絡話題集合New。
優選地,所述步驟S22中采用向量空間模型來構建話題模型:
V(d)=(t1,w1(d);…;ti,wi(d);…;tn,wn(d)
其中,ti是從文檔d中選出的特征項,wi(d)為ti在文檔d中的權重。
優選地,所述步驟S2中計算特征詞權重,包括:
首先根據人工設立的網絡熱詞庫篩選出關鍵詞元,對于關鍵詞元按如下公式計算權重:
Wi(keyword)=Wi(d)+Wi(d)/3
其中,式中Len(T)為文章長度,Wi為關鍵詞第i次在文本中出現的位置;
其余特征詞的權重采用如下經典的tf-idf權重計算公式:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于首都師范大學,未經首都師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110023421.6/2.html,轉載請聲明來源鉆瓜專利網。





