[發明專利]一種異常數據搜索模型的確定方法及裝置在審
| 申請號: | 202010623846.6 | 申請日: | 2020-06-30 |
| 公開(公告)號: | CN111782954A | 公開(公告)日: | 2020-10-16 |
| 發明(設計)人: | 黃翔豐;汪亞男;肖和兵;李元;蘭沖 | 申請(專利權)人: | 深圳前海微眾銀行股份有限公司 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F16/955;G06K9/62 |
| 代理公司: | 北京同達信恒知識產權代理有限公司 11291 | 代理人: | 張懷陽 |
| 地址: | 518027 廣東省深圳市*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 異常 數據 搜索 模型 確定 方法 裝置 | ||
1.一種異常數據搜索模型的確定方法,其特征在于,包括:
獲取標簽;所述標簽是對客戶的登記信息、賬戶性質和交易信息預處理得到的;
根據用戶輸入的標簽和標簽庫中標簽得到多個智能推薦標簽;以使所述用戶選擇所述智能推薦標簽;所述標簽庫是將所述標簽進行存儲得到的;
將所述用戶輸入的標簽結合所述用戶選擇的所述智能推薦標簽,得到標簽組合;
根據所述標簽組合確定數據搜索模型。
2.如權利要求1所述的方法,其特征在于,所述標簽庫中的標簽包括標簽搜索日志中的搜索標簽、模型標簽和案例標簽;
所述根據所述用戶輸入的標簽和所述標簽庫中標簽得到多個智能推薦標簽,包括:
將所述搜索標簽、所述模型標簽和所述案例標簽的格式進行統一化處理,得到樣本集;
將所述樣本集根據所述搜索標簽、所述模型標簽和所述案例標簽得到多個樣本文件;
將所述多個樣本文件根據TF-IDF算法進行計算,得到所述樣本集中各標簽的權重;
將所述各標簽結合所述各標簽的權重,得到數據集;
通過K均值聚類算法將所述數據集進行聚類,并進行排序;得到簇集;
根據所述用戶輸入的標簽與所述簇集得到多個所述智能推薦標簽。
3.如權利要求2所述的方法,其特征在于,所述將所述多個樣本文件根據TF-IDF算法進行計算,得到所述樣本集中各標簽的權重,包括:
確定出各樣本文件中每個標簽的詞頻與逆向文件頻率;
將所述詞頻與所述逆向文件頻率的乘積確定為所述樣本集中各標簽的權重。
4.如權利要求2所述的方法,其特征在于,所述通過K均值聚類算法將所述數據集進行聚類,并進行排序;得到簇集,包括:
將所述數據集分K個簇,并在所述數據集中隨機確定出K個第一中心元素,得到第一中心集;其中K為正整數;
確定出所述數據集中每個非第一中心元素與所述K個第一中心元素之間的距離,將距離最小的非中心元素與對應的所述第一中心元素確定為同一簇,根據同一簇中各元素之間的距離及各元素的權重確定同一簇中各元素的序號,得到第一簇集;
根據所述第一簇集得到所述第二中心集和第二簇集,再根據所述第二簇集得到所述第三中心集和第三簇集;
判斷所述第二中心集與所述第三中心集是否相等,若是,則確定所述第二簇集或第三簇集為所述簇集;否則根據當前得到的所述第三簇集,得到下一中心集和下一簇集,直至確定當前得到的中心集與下一中心集相等為止。
5.如權利要求4所述的方法,其特征在于,所述根據所述第一簇集得到所述第二中心集和第二簇集,再根據所述第二簇集得到所述第三中心集和第三簇集,包括:
計算所述第一簇集中每個簇的第一均值,確定出所述第一簇集中每個簇中的所有元素與所述第一均值之間的距離,將所述第一簇集中每個簇中元素與所述第一均值之間的距離最小的元素確定為第二中心元素,得到第二中心集,根據所述第二中心集,重新確定出所述數據集中每個非第二中心元素與K個所述第二中心元素之間的距離,將距離最小的每個非第二中心元素與對應的所述第二中心元素確定為同一簇,根據同一簇中各元素之間的距離及各元素的權重確定同一簇中各元素的序號,得到第二簇集;
計算所述第二簇集中每個簇的第二均值,確定出所述第二簇集中每個簇中的所有元素與所述第二均值之間的距離,將所述第二簇集中每個簇中元素與所述第二均值之間的距離最小的元素確定為第三中心元素,得到第三中心集,根據所述第三中心集,再確定出所述數據集中每個非第三中心元素與K個所述第三中心元素之間的距離,將距離最小的每個非第三中心元素與對應的所述第三中心元素確定為同一簇,根據同一簇中各元素之間的距離及各元素的權重確定同一簇中各元素的序號,得到第三簇集。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳前海微眾銀行股份有限公司,未經深圳前海微眾銀行股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010623846.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種伸縮箱調節式的卷布裝置
- 下一篇:一種異常流量判斷方法及裝置
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





