[發明專利]數據內容個性化推送冷啟動方法、裝置、設備和存儲介質在審
| 申請號: | 202010162324.0 | 申請日: | 2020-03-10 |
| 公開(公告)號: | CN111460251A | 公開(公告)日: | 2020-07-28 |
| 發明(設計)人: | 吳岸城;謝小文 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06F16/951 | 分類號: | G06F16/951;G06F16/9535;G06K9/62;H04L29/08 |
| 代理公司: | 北京市京大律師事務所 11321 | 代理人: | 劉挽瀾 |
| 地址: | 518033 廣東省深圳市福田區福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據 內容 個性化 推送 冷啟動 方法 裝置 設備 存儲 介質 | ||
本發明涉及大數據領域中的數據分析技術領域,尤其涉及一種數據內容個性化推送冷啟動方法、裝置、設備和存儲介質。該方法包括:從外部網絡中獲取新聞數據,對新聞數據進行清洗、統一格式和過濾重復數據,得到多篇新聞數據;獲取多篇預置數據,將預置數據和新聞數據作為多篇待導入數據預測話題標簽;待導入數據導入搜索服務器,將導入的所有數據及對應的話題標簽進行倒排索引處理;獲取用戶輸入的字段,根據字段在搜索服務器中進行搜索,得到搜索結果;對搜索結果進行個性化排序后推送給用戶。本發明在缺少用戶行為數據或業務系統單一的情況下,只需用戶輸入字段,即可匹配出搜索結果。
技術領域
本發明涉及大數據領域中的數據分析技術領域,尤其涉及一種數據內容個性化推送冷啟動方法、裝置、設備和存儲介質。
背景技術
個性化數據內容的推送是大數據領域的重要方向,對于大多數的電商或者內容(新聞、視頻、圖片)系統來說這是一種必要的技術。在現有產業內推送應用中,大多數都必須有大量用戶的歷史行為和興趣的數據,來預測用戶未來的行為和興趣。但是對于缺少這些數據的情況下,即推送的冷啟動情況下,對于個性化數據內容推送帶來了困難,現有解決冷啟動的方式有如下幾種:
1)基于人工規則與專家系統,依靠人對某一領域了解后進行梳理和擬寫規則,在冷啟動的時候進行硬規則的匹配以獲取推送的候選信息,此方式需要占用大量的人工。
2)利用用戶在其他地方已經沉淀的數據進行冷啟動。在一些大規模型公司的產品,通過各大產品打通的日志系統,提取用戶的行為特征去確定用戶行為數據。但對于業務系統單一或小規模型公司來說并沒有關聯數據或系統的情況下難以實現推送的冷啟動。
3)制造選項,讓用戶選擇自己感興趣的點后,即時生成粗粒度的推送。相對前面兩個來說,路徑不夠自然,需要用戶提前選擇,用戶體驗相對較差。
發明內容
有鑒于此,有必要針對現有的解決冷啟動的內容推送方式不理想的問題,提供一種數據內容個性化推送冷啟動方法、裝置、設備和存儲介質。
一種數據內容個性化推送冷啟動方法,包括:
定期從外部網絡中獲取多篇新聞數據,對每篇所述新聞數據進行清洗后存入數據庫中,定期從所述數據庫中取出更新的新聞數據,將所述新聞數據統一格式和過濾重復數據,得到多篇新聞數據;
定期獲取多篇預置數據,將多篇所述預置數據和多篇所述新聞數據作為多篇待導入數據分別通過預設的預測模型預測話題標簽,將每個所述待導入數據分別標記對應的所述話題標簽;
調用預設的搜索服務器,將所述待導入數據導入所述搜索服務器,通過所述搜索服務器將導入的所有數據及對應的話題標簽進行倒排索引處理;
獲取用戶輸入的字段,判斷所述字段是否為話題標簽,若是話題標簽,則根據所述字段直接在所述搜索服務器中進行搜索,得到搜索結果,否則,對所述字段通過所述預測模型預測目標標簽,根據所述目標標簽在所述搜索服務器中進行搜索,得到搜索結果;
對所述搜索結果進行個性化排序,將排序后的所述搜索結果推送給用戶。
一種可能的設計中,所述對所述字段通過所述預測模型預測目標標簽,包括:
對所述字段進行分詞處理,得到多個分詞,對多個分詞通過與預設的中文停用詞表進行對比,去除停用詞;
調用預設的詞向量模型,通過所述詞向量模型將多個所述分詞轉換為多個詞向量值;
調用預設的分類器模型,通過所述分類器模型對多個所述詞向量值預測出目標標簽。
一種可能的設計中,所述對所述搜索結果進行個性化排序,將排序后的所述搜索結果推送給用戶,包括:
對所有的所述搜索結果通過預設的個性化模型進行預測,得到每個所述搜索結果對應的概率值;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010162324.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:應用程序識別方法、系統、存儲介質以及電子設備
- 下一篇:一種休眠方法和裝置
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 內容再現系統、內容提供方法、內容再現裝置、內容提供裝置、內容再現程序和內容提供程序
- 內容記錄系統、內容記錄方法、內容記錄設備和內容接收設備
- 內容服務系統、內容服務器、內容終端及內容服務方法
- 內容分發系統、內容分發裝置、內容再生終端及內容分發方法
- 內容發布、內容獲取的方法、內容發布裝置及內容傳播系統
- 內容提供裝置、內容提供方法、內容再現裝置、內容再現方法
- 內容傳輸設備、內容傳輸方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容發送設備、內容發送方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容再現裝置、內容再現方法、內容再現程序及內容提供系統
- 內容記錄裝置、內容編輯裝置、內容再生裝置、內容記錄方法、內容編輯方法、以及內容再生方法





