[發明專利]數據清理和標準化以及地理編碼方法有效
| 申請號: | 201480051206.5 | 申請日: | 2014-08-14 |
| 公開(公告)號: | CN105580003B | 公開(公告)日: | 2019-01-25 |
| 發明(設計)人: | 伊高爾·羅伊特布拉特;喬納森·霍爾丹 | 申請(專利權)人: | 快捷四通有限公司 |
| 主分類號: | G06F17/20 | 分類號: | G06F17/20;G06F16/29;G06F5/00;G09B29/10 |
| 代理公司: | 北京英賽嘉華知識產權代理有限責任公司 11204 | 代理人: | 王達佐;王艷春 |
| 地址: | 加拿大*** | 國省代碼: | 加拿大;CA |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據 清理 標準化 以及 地理 編碼 方法 | ||
本技術的實施方式涉及數據清理和標準化以及應用數據清理和標準化的地理編碼方法。示例性方法包括清理地理數據集合,以及利用標準化的編輯距離算法使清理后的地理數據標準化。
相關申請的交叉引用
本申請要求于2013年8月14日提交的標題為“用于地理編碼和校正地理編碼的數據的系統及方法(System and Methods for Geocoding and Correcting CeocodedData)”的第61/865,984號美國臨時申請的優先權,該申請通過引用以其整體并入本文,該申請的整體包括其中所引用的全部參考文獻。
技術領域
本技術大體涉及地理編碼和地圖制作,并且更具體地,但不限于,涉及恰當地對興趣點進行地理編碼的系統和方法,其中每個興趣點由來自不同數據庫的多個有差異的表達表示。本技術使這些有差異的表達一致化,以增加這些地理編碼的位置的一致性。
發明內容
本技術的實施方式包括一種方法,包括:
(a)接收字符的兩個多片段集合,字符的兩個多片段集合中的每個包括多個片段,片段中的每個包括格式;
(b)通過以下操作清理字符的兩個多片段集合中的每個:(i)如果片段的格式未處于標準化格式,則將字符的多片段集合的多個片段中的片段轉化成標準化格式;以及(ii)通過根據轉化的片段和未轉化的片段中產生連續字符串來縮小字符的兩個多片段集合中的每個;以及(c)利用字符的清理后的多片段集合計算距離分數,距離分數表示字符的清理后的多片段集合中的字符之間的差異。
本技術的其它實施方式包括一種計算裝置,包括:(a)存儲器,用于存儲可執行指令;以及(b)處理器,用于執行可執行指令,以:(i)接收字符的兩個多片段集合,字符的兩個多片段集合中的每個包括多個片段,片段中的每個包括格式;(ii)通過以下操作清理字符的兩個多片段集合:(1)如果片段的格式未處于標準化格式,則將多片段字符串的多個片段中的片段轉化成標準化格式;以及(2)通過根據多個轉化的片段中產生連續字符串來縮小字符的兩個多片段集合;(iii)計算用于字符的清理后的多片段集合的標準化編輯距離(NLD),其中標準化編輯距離通過以下操作計算:(A)計算用于字符的清理后的多片段集合的編輯距離(LD);(B)利用方程:
NLD=1-(LD1-abs([LS1]-[LS2]))/min([LDl],[LS2])
將LD標準化,其中LS1是字符的清理后的多片段集合的第一字符串的長度,并且LS2是字符的清理后的多片段集合的第二字符串的長度。
本技術的另外的實施方式包括一種地理編碼的方法,地理編碼的方法包括:(a)接收可能表示同一興趣點的、字符的兩個多片段集合,字符的兩個多片段集合中的每個包括多個片段,片段中的每個包括格式;(b)如果片段的格式未處于標準化格式,則將多片段字符串的多個片段中的片段轉化成標準化格式;(c)通過根據轉化的片段和未轉化的片段中產生連續字符串來縮小字符的兩個多片段集合中的每個;(d)利用字符的清理后的多片段集合計算距離分數,距離分數表示字符的清理后的多片段集合中的字符之間的差異;(d)將距離分數與閾值比較;以及(e)如果距離分數小于閾值,則將數據庫中字符的清理后的多片段集合確定為表示同一興趣點。
附圖說明
圖1是用于實施本技術的多方面的計算環境的高階示意圖。
圖2是示出了地理編碼過程的示意性流程圖。
圖3是地圖的立體圖,該立體圖示出了表示同一物理興趣點的兩個地理編碼點之間的物理距離計算的過程。
圖4是本技術的方法的流程圖。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于快捷四通有限公司,未經快捷四通有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201480051206.5/2.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





