[發明專利]數據處理方法、裝置、服務器和存儲介質有效
| 申請號: | 201911343379.5 | 申請日: | 2019-12-24 |
| 公開(公告)號: | CN111090686B | 公開(公告)日: | 2023-04-18 |
| 發明(設計)人: | 華鵬;謝明辰;康偉樂 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F16/2458 | 分類號: | G06F16/2458;G06F16/27;G06F16/28 |
| 代理公司: | 深圳翼盛智成知識產權事務所(普通合伙) 44300 | 代理人: | 汪阮磊 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據處理 方法 裝置 服務器 存儲 介質 | ||
本發明實施例公開了一種數據處理方法、裝置、服務器和存儲介質;本發明實施例獲取目標算子、數據血緣網絡和目標數據實體集,目標數據實體集中包括多個目標數據實體,數據血緣網絡中包括多個節點,以及節點之間的流向線路;在數據血緣網絡中確定目標節點,以及與目標節點相連的相關節點,目標節點對應目標數據實體,相關節點對應其他數據實體;根據目標節點和相關節點之間的流向線路,生成目標數據實體和其他數據實體之間的實體關系信息;基于實體關系信息以及目標算子構建目標數據實體的特征集合;對特征集合中的特征進行評分預測,得到特征集合中特征的預測評分;根據預測評分在特征集合中確定預測特征。本方案可以提升數據處理的效率。
技術領域
本發明涉及計算機領域,具體涉及一種數據處理方法、裝置、服務器和存儲介質。
背景技術
特征工程(Feature?engineering)又叫作特征構造,是基于現有數據來構造新特征,從而利用這些新特征來訓練機器學習模型的過程。其中,構造新特征的過程中往往需要對現有數據之間的關系進行深入的分析,才能從現有數據中提取有用的特征信息。
然而,由于每個新特征可能都需要經過多個步驟去構造,尤其是那些與多個現有數據有關的特征,所以目前新特征的構造是一個非常耗時的過程,且需要人工干預才能夠順利地對現有數據進行新特征的提取處理,因此,目前用于特征構造的數據處理方法效率低下。
發明內容
本發明實施例提供一種數據處理方法、裝置、服務器和存儲介質,可以提升數據處理方法的效率。
本發明實施例提供一種數據處理方法,包括:
獲取目標算子、數據血緣網絡和目標數據實體集,所述目標數據實體集中包括多個目標數據實體,所述數據血緣網絡中包括多個節點,以及所述節點之間的流向線路;
在所述數據血緣網絡中確定目標節點,以及與所述目標節點相連的相關節點,所述目標節點對應目標數據實體,所述相關節點對應其他數據實體;
根據所述目標節點和相關節點之間的流向線路,生成所述目標數據實體和其他數據實體之間的實體關系信息;
基于所述實體關系信息以及目標算子構建所述目標數據實體的特征集合;
對所述特征集合中的特征進行評分預測,得到所述特征集合中特征的預測評分;
根據所述預測評分在特征集合中確定預測特征。
本發明實施例還提供一種數據處理裝置,包括:
獲取單元,用于獲取目標算子、數據血緣網絡和目標數據實體集,所述目標數據實體集中包括多個目標數據實體,所述數據血緣網絡中包括多個節點,以及所述節點之間的流向線路;
節點單元,用于在所述數據血緣網絡中確定目標節點,以及與所述目標節點相連的相關節點,所述目標節點對應目標數據實體,所述相關節點對應其他數據實體;
關系單元,用于根據所述目標節點和相關節點之間的流向線路,生成所述目標數據實體和其他數據實體之間的實體關系信息;
特征單元,用于基于所述實體關系信息以及目標算子構建所述目標數據實體的特征集合;
評分單元,用于對所述特征集合中的特征進行評分預測,得到所述特征集合中特征的預測評分;
預測單元,用于根據所述預測評分在特征集合中確定預測特征。
在一些實施例中,所述獲取單元,包括:
獲取子單元,用于獲取用戶的數據處理指令,以及數據庫集群的歷史操作信息;
確定子單元,用于基于所述數據處理指令確定目標算子和目標數據實體;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911343379.5/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種納米銀導電膜用涂布液
- 下一篇:一種沖擊電流抑制裝置





