[發(fā)明專利]基于數(shù)據(jù)挖掘的社保數(shù)據(jù)處理方法、裝置和計算機設備在審
| 申請?zhí)枺?/td> | 201910171606.4 | 申請日: | 2019-03-07 |
| 公開(公告)號: | CN110008250A | 公開(公告)日: | 2019-07-12 |
| 發(fā)明(設計)人: | 陳嫻嫻;阮曉雯;徐亮 | 申請(專利權(quán))人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06F16/2458 | 分類號: | G06F16/2458;G06Q40/08 |
| 代理公司: | 廣州華進聯(lián)合專利商標代理有限公司 44224 | 代理人: | 王寧;劉剛 |
| 地址: | 518033 廣東省深圳市福田區(qū)福*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 社保 特征向量 資源獲取 字段數(shù)據(jù) 數(shù)據(jù)分析模型 計算機設備 請求類型 請求信息 數(shù)據(jù)挖掘 數(shù)據(jù)處理 相似度 預設 分析效率 接收終端 數(shù)據(jù)包括 數(shù)據(jù)對應 數(shù)據(jù)推送 預設算法 向量化 有效地 準確率 發(fā)送 終端 挖掘 申請 分析 | ||
本申請涉及一種基于數(shù)據(jù)挖掘的社保數(shù)據(jù)處理方法、裝置和計算機設備。所述方法包括:接收終端發(fā)送的資源獲取請求,資源獲取請求包括請求類型和請求信息;根據(jù)資源獲取請求和請求信息獲取多個社保數(shù)據(jù),社保數(shù)據(jù)包括多個字段數(shù)據(jù);對社保數(shù)據(jù)對應的多個字段數(shù)據(jù)進行向量化,得到多個字段數(shù)據(jù)對應的特征向量;根據(jù)預設算法計算多個特征向量之間的相似度,提取出相似度達到預設閾值的特征向量;根據(jù)請求類型獲取預設的數(shù)據(jù)分析模型,通過數(shù)據(jù)分析模型對提取的特征向量進行分析,得到對應的分析結(jié)果數(shù)據(jù);將分析結(jié)果數(shù)據(jù)推送至對應的終端。采用本方法能夠有效對社保數(shù)據(jù)進行挖掘,并有效地提高社保數(shù)據(jù)的分析效率和準確率。
技術(shù)領域
本申請涉及計算機技術(shù)領域,特別是涉及一種基于數(shù)據(jù)挖掘的社保數(shù)據(jù)處理方法、裝置和計算機設備。
背景技術(shù)
隨著經(jīng)濟的飛速發(fā)展,社會保險成為了民生經(jīng)濟的重要組成部分。隨著計算機技術(shù)的不斷發(fā)展,社會保險人員登記、社會保險金征收、社會保險金償付等各個業(yè)務流程已經(jīng)全部實現(xiàn)網(wǎng)絡化和信息化,社保業(yè)務系統(tǒng)也積累了大量的社保數(shù)據(jù)。
現(xiàn)有的對社保數(shù)據(jù)進行挖掘的方式中,大多的只是對社保數(shù)據(jù)進行查詢以及簡單的數(shù)據(jù)處理,對這些大量的社保數(shù)據(jù)沒有進行更深層次的分析和挖掘。且大量的社保數(shù)據(jù)具有數(shù)據(jù)量大,信息度繁雜冗余,在對大量的社保數(shù)據(jù)進行挖掘和分析時,大量的社保數(shù)據(jù)極易存在挖掘度深度不夠、流程混亂等情況,導致數(shù)據(jù)挖掘的效率和準確率較低。
發(fā)明內(nèi)容
基于此,有必要針對上述技術(shù)問題,提供一種能夠有效挖掘出社保數(shù)據(jù)中有價值的信息,并有效地提高社保數(shù)據(jù)的分析效率和準確率的基于數(shù)據(jù)挖掘的社保數(shù)據(jù)處理方法、裝置和計算機設備。
一種基于數(shù)據(jù)挖掘的社保數(shù)據(jù)處理方法,所述方法包括:
接收終端發(fā)送的資源獲取請求,所述資源獲取請求包括請求類型和請求信息;
根據(jù)所述資源獲取請求和請求信息獲取多個社保數(shù)據(jù),所述社保數(shù)據(jù)包括多個字段數(shù)據(jù);
對所述社保數(shù)據(jù)對應的多個字段數(shù)據(jù)進行向量化,得到多個字段數(shù)據(jù)對應的特征向量;
根據(jù)預設算法計算多個特征向量之間的相似度,提取出所述相似度達到預設閾值的特征向量;
根據(jù)所述請求類型獲取預設的數(shù)據(jù)分析模型,通過所述數(shù)據(jù)分析模型對提取的特征向量進行分析,得到對應的分析結(jié)果數(shù)據(jù);
將所述分析結(jié)果數(shù)據(jù)推送至對應的終端。
在其中一個實施例中,所述對所述社保數(shù)據(jù)對應的多個字段數(shù)據(jù)進行向量化的步驟,包括:獲取預設的語料庫,根據(jù)所述社保數(shù)據(jù)從所述語料庫中獲取相關聯(lián)的語料數(shù)據(jù);獲取預設的向量訓練模型,通過所述向量訓練模型對所述社保數(shù)據(jù)和所述語料數(shù)據(jù)進行詞向量計算和訓練,得到對應的多個詞向量;根據(jù)預設算法將所述詞向量轉(zhuǎn)換為對應的特征向量。
在其中一個實施例中,所述根據(jù)預設算法計算多個特征向量之間的相似度,提取出相似度達到預設閾值的特征向量步驟,包括:根據(jù)預設的目標函數(shù)計算多個特征向量的多個維度值;根據(jù)預設的距離算法和所述維度值計算多個特征向量之間的相似度;提取出所述相似度達到預設閾值的特征向量。
在其中一個實施例中,通過所述數(shù)據(jù)分析模型對提取的特征向量進行分析的步驟,包括:通過所述數(shù)據(jù)分析模型計算出多個特征向量的分布值和字段飽和度;對多個特征向量進行統(tǒng)計篩查,提取達到預設飽和值的特征向量;根據(jù)預設的語義分析算法,對提取出的特征向量進行分析,得到特征向量的權(quán)重;根據(jù)所述特征向量的分布值和字段飽和度以及權(quán)重進行分析,得到所述特征向量對應多個類型的指標數(shù)據(jù)和對應的數(shù)值;根據(jù)所述多個類型的指標數(shù)據(jù)和對應的數(shù)值生成分析結(jié)果數(shù)據(jù)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于平安科技(深圳)有限公司,未經(jīng)平安科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910171606.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 信息處理設備和信息處理方法
- 一種操作日志生成方法、服務器及業(yè)務運營支撐系統(tǒng)
- 一種大字段數(shù)據(jù)的處理方法及裝置
- 一種大字段數(shù)據(jù)的處理方法及裝置
- 動態(tài)字段數(shù)據(jù)返回接口的測試系統(tǒng)、方法、電子設備和可讀存儲介質(zhì)
- 用于生成多工作表導出的系統(tǒng)和方法
- 大數(shù)據(jù)文件讀取方法、裝置、計算機設備及存儲介質(zhì)
- 數(shù)據(jù)關聯(lián)方法及裝置、電子設備
- 多源異構(gòu)數(shù)據(jù)處理方法及裝置
- 數(shù)據(jù)導入方法、裝置、系統(tǒng)及計算機可讀存儲介質(zhì)





