[發明專利]名單數據篩選方法、裝置、計算機設備及存儲介質在審
| 申請號: | 202010936334.5 | 申請日: | 2020-09-08 |
| 公開(公告)號: | CN112084408A | 公開(公告)日: | 2020-12-15 |
| 發明(設計)人: | 徐杰 | 申請(專利權)人: | 中國平安財產保險股份有限公司 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06K9/62 |
| 代理公司: | 深圳市世聯合知識產權代理有限公司 44385 | 代理人: | 汪琳琳 |
| 地址: | 518000 廣東省深圳市福田區益田路*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 名單 數據 篩選 方法 裝置 計算機 設備 存儲 介質 | ||
本申請實施例屬于大數據技術領域,涉及一種名單數據篩選方法,包括:獲取歷史信息記錄,根據歷史信息記錄確定對應的初始名單數據;基于預設的相似度模型,獲取初始名單數據與樣本數據的總相似度;根據總相似度對初始名單數據進行篩選,得到無效數據和候選數據;在無效數據的占比值小于預設占比時,對候選數據進行再篩選,得到最終的可選名單數據;基于階段模型,計算可選名單數據對應的預測評分,將預測評分大于等于預設評分閾值的可選名單數據,選定為最終名單數據。本申請還提供一種名單數據篩選裝置、計算機設備及存儲介質。此外,本申請還涉及區塊鏈技術,所述最終名單數據可存儲于區塊鏈中。本申請實現了對用戶數據的精確篩選。
技術領域
本申請涉及大數據技術領域,尤其涉及一種名單數據篩選方法、裝置、計算機設備及存儲介質。
背景技術
隨著信息技術的快速發展,無論是在線上還是在線下,每天都會有大量的數據被傳遞出去,人們也同時每天接收著由外界傳來的大量的各種不同信息。然而,如何將信息向用戶進行針對性的推送,使得接收該信息的群體是真正需要該信息的群體,是當前研究的熱點。
傳統的用戶篩選通常采用線下人工拜訪采集數據,然后進行人工篩選用戶,再針對該類用戶進行信息推薦,這種方式通常效率低下,并且無法對大量的數據進行精確分析處理。當前,針對線上的用戶群體,盡管能夠通過大數據進行數據分析,得到可能需要某類信息的用戶群體。但是,在通過這種方式進行篩選時,由于數據量大仍然會存在篩選精度差,無法篩選到真正所需要當前推薦內容的用戶,所篩選的用戶粘性低的問題。因此,如何在大量信息中實現高精度用戶數據篩選,是一個丞待解決的技術問題。
發明內容
本申請實施例的目的在于提出一種名單數據篩選方法、裝置、計算機設備及存儲介質,以解決當前無法在大量信息中實現高精度數據篩選的技術問題。
為了解決上述技術問題,本申請實施例提供一種名單數據篩選方法,采用了如下所述的技術方案:
獲取歷史信息記錄,根據所述歷史信息記錄確定對應的初始名單數據;
基于預設的相似度模型,獲取所述初始名單數據與樣本數據的總相似度;
根據所述總相似度對所述初始名單數據進行篩選,得到無效數據和候選數據;
計算所述無效數據在所述初始名單數據中的第一占比值,在所述無效數據的第一占比值小于預設占比時,對所述候選數據進行再篩選,直至累計篩選出的所述無效數據的總和在所述初始名單數據中的第二占比值大于等于所述預設占比,得到最終的可選名單數據;
基于預設的階段模型,計算每個所述可選名單數據對應的預測評分,將所述預測評分大于等于預設評分閾值的可選名單數據,選定為最終名單數據。
進一步的,在所述基于預設的相似度模型,獲取所述初始名單數據與樣本數據的總相似度的步驟之前還包括:
預先建立基礎訓練模型,基于采集的訓練數據對所述基礎訓練模型進行訓練,其中,所述訓練數據包括正樣本數據和負樣本數據;
在所述基礎訓練模型對所述正樣本數據和所述負樣本數據的識別成功率達到預設成功率,確定所述基礎訓練模型訓練完成,得到對應的相似度模型。
進一步的,所述基于預設的相似度模型,獲取所述初始名單數據與樣本數據的總相似度的步驟具體包括:
將所述初始名單數據中各項數據與樣本數據中對應項的數據,通過預設的相似度模型進行計算,得到所述初始名單數據中每項數據對應的子相似度;
計算所有所述子相似度的和,以及所述和在所述初始名單數據總項數中占比,所述占比即為所述初始名單數據和所述樣本數據的總相似度。
進一步的,所述計算每個所述可選名單數據對應的預測評分的步驟具體包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國平安財產保險股份有限公司,未經中國平安財產保險股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010936334.5/2.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





