[發明專利]數據分類方法、裝置、電子設備及計算機可讀存儲介質有效
| 申請號: | 201810714517.5 | 申請日: | 2018-06-29 |
| 公開(公告)號: | CN109063736B | 公開(公告)日: | 2020-09-25 |
| 發明(設計)人: | 葛偉平;鄒鐵山;王敏 | 申請(專利權)人: | 考拉征信服務有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 北京智信四方知識產權代理有限公司 11519 | 代理人: | 劉真 |
| 地址: | 100080 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據 分類 方法 裝置 電子設備 計算機 可讀 存儲 介質 | ||
本公開實施例公開了一種數據分類方法、裝置、電子設備及計算機可讀存儲介質。其中,該方法包括:獲取候選數據分類模型,其中,所述候選數據分類模型是根據訓練數據訓練得到的;響應于接收到攜帶有用戶數據的數據分類請求,根據用戶數據從所述候選數據分類模型中確定目標數據分類模型;利用所述目標數據分類模型對于所述用戶數據進行分類。
技術領域
本公開涉及數據處理領域,具體涉及一種數據分類方法、裝置、電子設備及計算機可讀存儲介質。
背景技術
隨著互聯網和人工智能技術的發展,提供給用戶的服務產品越來越豐富,用戶參與的社會性活動也越來越多,比如:購物、外賣、移動支付等等,由此也產生了用戶參與各項活動的大數據,基于這些大數據可以實現多種目的的數據統計或評估,比如消費水平統計或評估、征信數據統計或評估、用戶操作傾向性統計或評估等等。具體在操作時,通常是將用戶的大數據輸入至統一預設的統計評估模型中,得到統計評估結果。
然而,發明人在實現本公開實施例相關技術方案的過程中發現,現有技術至少存在以下問題:由于互聯網大數據的來源和形式的多樣性,導致用戶數據經常存在部分缺失,例如由于涉及隱私問題,用戶1的年齡信息無法獲得,或者用戶2的收入水平無法獲得,等等。現有的處理方式是:通過大數據分析得到缺失數據項的平均值或估值,然后將該平均值或估值作為缺失數據進行統計或評估。但這種對于平均值或估值等非真實性數據的使用不可避免地會對統計評估結果的準確性帶來影響,而且該影響還有可能會超過其他真實數據對統計評估結果的影響,進而導致數據統計評估結果的準確度十分低下。
發明內容
針對現有技術中的上述技術問題,本公開實施例提出了一種數據分類方法、裝置、電子設備及計算機可讀存儲介質,以解決非真實性數據的使用所帶來的統計評估結果準確性低下的問題。
本公開實施例的第一方面提供了一種數據分類方法,包括:
獲取候選數據分類模型,其中,所述候選數據分類模型是根據訓練數據訓練得到的;
響應于接收到攜帶有用戶數據的數據分類請求,根據用戶數據從所述候選數據分類模型中確定目標數據分類模型;
利用所述目標數據分類模型對于所述用戶數據進行分類。
在一些實施例中,所述訓練數據包括:用戶標識、對應的用戶參數以及用戶類別。
在一些實施例中,根據訓練數據訓練得到候選數據分類模型,包括:
對所述用戶參數進行分類;
根據用戶參數分類結果對用戶進行分類;
基于用戶分類結果以及用戶參數訓練得到與用戶類別對應的數據分類模型,作為候選數據分類模型。
在一些實施例中,所述對用戶參數進行分類為:根據參數的完備性對所述用戶參數進行分類。
在一些實施例中,所述響應于接收到數據分類請求,根據用戶數據從所述候選數據分類模型中確定目標數據分類模型,包括:
根據所述用戶數據確定優先級元素及相應的權重,所述用戶數據包括用戶標識和對應的用戶參數;
根據所述優先級元素及相應的權重對于所述候選數據分類模型進行有權評價;
根據候選數據分類模型的有權評價結果對于候選數據分類模型進行優先級排序;
選擇優先級最高的候選數據分類模型作為目標數據分類模型。
在一些實施例中,所述響應于接收到數據分類請求,根據用戶數據從所述候選數據分類模型中確定目標數據分類模型,還包括:
對所述目標數據分類模型的有效性進行驗證;
根據驗證結果對于所述目標數據分類模型進行再選擇。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于考拉征信服務有限公司,未經考拉征信服務有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810714517.5/2.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





