[發明專利]融合數據表的方法和裝置在審
| 申請號: | 201810515355.2 | 申請日: | 2018-05-25 |
| 公開(公告)號: | CN110532254A | 公開(公告)日: | 2019-12-03 |
| 發明(設計)人: | 張思為 | 申請(專利權)人: | 杭州海康威視數字技術股份有限公司 |
| 主分類號: | G06F16/22 | 分類號: | G06F16/22 |
| 代理公司: | 11138 北京三高永信知識產權代理有限責任公司 | 代理人: | 韓東艷<國際申請>=<國際公布>=<進入 |
| 地址: | 310051 浙江省*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據項 融合 電子技術領域 方法和裝置 | ||
本公開是關于一種融合數據表的方法和裝置,屬于電子技術領域。所述方法包括:獲取至少兩個子數據表;建立融合數據表,將各子數據表中包括的各數據項,設置在融合數據表中;對于各子數據表中不同的數據項,將不同的數據項在所屬的子數據表中的數據,分別添加到融合數據表中;對于屬于不同子數據表的相同數據項,如果相同數據項是單值數據項,基于各子數據表的優先級,在包含相同數據項的各子數據表中,確定優先級最高的目標子數據表,將相同數據項在目標子數據表中的數據,添加到融合數據表中。采用本公開,可以提高融合數據表中的數據的準確性。
技術領域
本公開是關于電子技術領域,尤其是關于一種融合數據表的方法和裝置。
背景技術
在現有技術中,可以通過多種渠道獲取多個數據表,例如外來人口數據表、當地案件數據表、走訪記錄數據表等。可以基于數據分析方法對多個數據表中的數據進行分析,獲得分析結果,例如對外來人口數據表、當地案件數據表、走訪記錄數據表中的數據進行分析,確定待查找人員的范圍等。
在基于數據分析方法對多個數據表中的數據進行分析之前,需要對多個數據表進行融合。這樣,在對多個數據表中的數據進行分析的過程中,省去從單個數據表讀取數據的過程,利于提高對數據分析的效率。
在實現本公開的過程中,發明人發現至少存在以下問題:
在現有技術中,在對多個數據表進行融合的過程中,如果檢測到相同數據項中的數據不匹配時,會隨機選擇一個數據進行保存。例如,在外來人口數據表中某人的姓名登記為“張三”,在走訪記錄數據表中同一人的姓名登記為“張四”,在融合時,可以基于主鍵如身份證號碼進行融合,即將相同主鍵對應的外來人口數據表和走訪記錄數據表進行融合。由于外來人口數據表中的姓名和走訪記錄數據表中的姓名不匹配,系統會隨機選擇“張三”或者“張四”中的一個數據進行保存。如果選擇了錯誤的數據進行保存,會降低數據表中的數據的準確性。
發明內容
為了克服相關技術中存在的問題,本公開提供了以下技術方案:
根據本公開實施例的第一方面,提供一種融合數據表的方法,所述方法包括:
獲取至少兩個子數據表;
建立融合數據表,將各子數據表中包括的各數據項,設置在所述融合數據表中;
對于各子數據表中不同的數據項,將所述不同的數據項在所屬的子數據表中的數據,分別添加到所述融合數據表中;
對于屬于不同子數據表的相同數據項,如果所述相同數據項是單值數據項,基于各子數據表的優先級,在包含所述相同數據項的各子數據表中,確定優先級最高的目標子數據表,將所述相同數據項在所述目標子數據表中的數據,添加到所述融合數據表中。
可選地,所述對于屬于不同子數據表的相同數據項,如果所述相同數據項是單值數據項,基于各子數據表的優先級,在包含所述相同數據項的各子數據表中,確定優先級最高的目標子數據表,將所述相同數據項在所述目標子數據表中的數據,添加到所述融合數據表中,包括:
對于屬于不同子數據表的相同數據項,如果所述相同數據項是單值數據項,且所述相同數據項在不同子數據表中的數據不同,則基于各子數據表的優先級,在包含所述相同數據項的各子數據表中,確定優先級最高的目標子數據表,將所述相同數據項在所述目標子數據表中的數據,添加到所述融合數據表中。
可選地,所述方法還包括:
對于屬于不同子數據表的相同數據項,如果所述相同數據項是多值數據項,且所述相同數據項在不同子數據表中的數據不同,則將所述相同數據項在不同子數據表中的不同數據,添加到所述融合數據表中。
可選地,在獲取至少兩個子數據表之前,所述方法還包括:
獲取各子數據表的數據來源信息;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州海康威視數字技術股份有限公司,未經杭州海康威視數字技術股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810515355.2/2.html,轉載請聲明來源鉆瓜專利網。





