[發明專利]一種數據處理方法及相關設備在審

申請號：	201910728773.4	申請日：	2019-08-07
公開（公告）號：	CN110427381A	公開（公告）日：	2019-11-08
發明（設計）人：	王飛;胡可云;陳聯忠	申請（專利權）人：	北京嘉和海森健康科技有限公司
主分類號：	G06F16/22	分類號：	G06F16/22;G06F16/2458;G06F17/27
代理公司：	北京集佳知識產權代理有限公司 11227	代理人：	王寶筠
地址：	100085 北京市海淀區上***	國省代碼：	北京;11
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	結構化數據分詞身份標識同一用戶數據處理主索引關聯保存數據記錄數據配置正整數預設數據庫存儲申請保證
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

本申請實施例提供了一種數據處理方法及相關設備，可以為同一身份標識的數據配置相同的主索引，既消除同一用戶多個身份標識，同時又保證同一用戶的數據記錄不會丟失。該方法包括：確定第一結構化數據，所述第一結構化數據包括N個分詞，其中，N為大于或等于1的正整數；根據所述N個分詞與第二結構化數據對應的分詞確定目標比例，所述第二結構化數據為數據庫中存儲的任意一個結構化數據；判斷所述目標比例是否大于預設值；若是，則將所述第一結構化數據關聯保存至所述第二結構化數據對應的主索引下。

技術領域

本申請涉及大數據領域，尤其涉及一種數據處理方法及相關設備。

背景技術

隨著網絡的進步，社會各界科研人員已逐步意識到數據應用的重要性，開始挖掘數據潛在的海量應用價值。

現有的用戶的數據信息多是分散的，同一用戶在不同的信息系統中的個人信息是不相同的，無法實現同一用戶的信息在各個分散信息系統間的自動關聯，甚至單個信息系統內都出現同一用戶存在多個身份標識，大量歷史數據難以應用。

如何解決消除同一用戶多個身份標識，同時又保證同一用戶的數據記錄不會丟失，是亟待解決的問題。

發明內容

本申請提供了一種數據處理方法及相關設備，可以為同一身份標識的數據配置相同的索引，既保證同一用戶只對應一個身份標識，同時又保證同一用戶的數據記錄不會丟失。

本申請實施例第一方面提供一種數據處理方法，所述方法包括：

確定第一結構化數據，所述第一結構化數據包括N個分詞，其中，N為大于或等于1的正整數；

根據所述N個分詞與第二結構化數據對應的分詞確定目標比例，所述第二結構化數據為數據庫中存儲的任意一個結構化數據；

判斷所述目標比例是否大于預設值；