[發明專利]一種增量碼庫的建立方法和裝置有效
| 申請號: | 201210227185.0 | 申請日: | 2012-06-30 |
| 公開(公告)號: | CN103514235B | 公開(公告)日: | 2017-03-08 |
| 發明(設計)人: | 林錫通;段建國 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京鴻德海業知識產權代理事務所(普通合伙)11412 | 代理人: | 袁媛 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 增量 建立 方法 裝置 | ||
1.一種增量碼庫的建立方法,其特征在于,包括以下步驟:
S1、獲取數據圖的更新數據;
S2、利用所獲取的更新數據與歷史增量數據庫中的歷史增量數據進行比較,將關鍵屬性相異的更新數據確定為非冗余數據;
S3、提取所述非冗余數據中描述地理對象的信息,添加到候選碼庫中;
S4、對所述候選碼庫中各候選數據的地理對象名稱和空間位置進行判斷,將描述同一個地理對象且空間位置在預設閾值范圍內的多個候選數據歸為同一個判重組;
S5、對同一個判重組內的多個候選數據,根據各候選數據的數據來源的可信度計算各候選數據的權值;
S6、將權值最高的候選數據作為該判重組的碼庫數據,構成增量碼庫。
2.根據權利要求1所述的方法,其特征在于,在所述步驟S1之后,還包括:
對所獲取的更新數據的格式進行預處理,轉換成預定義的數據格式。
3.根據權利要求1所述的方法,其特征在于,所述關鍵屬性包括:
數據的名稱、地址、數據來源、可信度和空間位置;
所述關鍵屬性相異的更新數據是指與所述歷史增量數據相比,至少有一種關鍵屬性相異的數據。
4.根據權利要求1所述的方法,其特征在于,在所述步驟S2之后,還包括:
將所確定的非冗余數據添加到所述歷史增量數據庫中。
5.根據權利要求1所述的方法,其特征在于,所述步驟S3包括:
步驟S3_1、對所述非冗余數據的名稱或地址進行分詞;
步驟S3_2、從名稱或地址的分詞結果中按照預定義的規則進行規范化處理后,得到描述地理對象的地理對象名稱;
步驟S3_3、關聯確定所述地理對象名稱對應的屬性信息,組成一條候選數據,添加到候選碼庫中;
其中,所述對應的屬性信息至少包括:該地理對象的空間位置。
6.根據權利要求5所述的方法,其特征在于,所述關聯確定所述地理對象名稱對應的屬性信息,包括:
將所述地理對象名稱所在的非冗余數據中包含的屬性信息,確定為該地理對象名稱所在的候選數據對應的屬性信息;
根據所述空間位置,對所述候選數據進行最小外接矩形計算,預估所述候選數據的范圍大小。
7.根據權利要求1所述的方法,其特征在于,在所述根據各候選數據的數據來源的可信度計算各候選數據的數據權值之前,還包括:
判斷所述判重組中的候選數據是否正確。
8.根據權利要求7所述的方法,其特征在于,所述判斷所述判重組中的候選數據是否正確,具體包括:
對提供數據來源的各個數據提供商提供的數據質量進行評估,確定可信來源的數據提供商;
判斷同一個判重組中是否有可信來源的數據,如果有,則認為該判重組中的數據正確,否則,計算判重組中各個候選數據的數據權值,如果判重組中的數據權值不小于預設閾值,則認為該判重組中的數據正確,否則,認為該判重組中的數據錯誤。
9.根據權利要求1所述的方法,其特征在于,所述根據各候選數據的數據來源的可信度計算各候選數據的數據權值,具體包括:
根據各候選數據的數據來源確定各個候選數據的可信度;
對提供數據來源的各個數據提供商提供的數據質量進行評估,將可信來源的數據作為校驗數據;
統計各候選數據關聯到的校驗數據的數量;
利用各個候選數據和關聯到的校驗數據的數量,計算得到各候選數據的數據權值。
10.根據權利要求1所述的方法,其特征在于,所述將數據權值最高的候選數據作為該判重組的碼庫數據,具體包括:
將數據權值最高的候選數據中的地理對象名稱和空間位置作為該判重組的碼庫數據對應的屬性值;
根據預設的類別優先級配置文件,從該判重組中所有的類別中確定出該判重組的碼庫數據的類別;
對于類別為道路類的碼庫數據,選擇包含點最多的候選數據的幾何形狀作為對應的屬性值,并對該判重組中所有的最小外接矩形求并集,得到的結果作為該碼庫數據的最小外接矩形的屬性值,其余的屬性對應選擇該判重組中數據權值最高的屬性值作為對應的屬性值;
對于類別為非道路類的碼庫數據,所有屬性均對應選擇數據權值最高的屬性值作為對應的屬性值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210227185.0/1.html,轉載請聲明來源鉆瓜專利網。





