[發明專利]一種基于多因子的行政區劃的可信度計算的方法有效
| 申請號: | 201510093347.X | 申請日: | 2015-03-02 |
| 公開(公告)號: | CN104657486B | 公開(公告)日: | 2018-01-19 |
| 發明(設計)人: | 李曉林;魏運運;張彥鐸;盧濤;段艷會;張玉敏;黃爽;萬永靜;楊威;夏天 | 申請(專利權)人: | 武漢工程大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 湖北武漢永嘉專利代理有限公司42102 | 代理人: | 王丹 |
| 地址: | 430074 湖北*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 因子 行政區劃 可信度 計算 方法 | ||
技術領域
本發明涉及中文地址的規范化,具體涉及一種基于多因子的行政區劃的可信度計算的方法。
背景技術
科技的不斷發展,人們對生活中各個方面的需求不斷提升,服務化社會成為未來發展的趨勢。作為服務化中的一種形式,當今地理信息位置服務是通過國家地理信息普查、實地勘察等方式獲取數據建立一個標準的中文地址庫,然后通過匹配進行信息返回。然而,這種形式存在隨著社會的不斷發展居民區、道路等因素的不斷變化,為標準參考數據集的建立帶來障礙。面對這個問題,將互聯網看成信息量大,并且不斷更新的大型數據庫。
互聯網的不斷發展,網絡上正誤交織的地理文本信息與日俱增,如何從這些紛繁復雜的信息中,辨別出相對于用戶需要的信任度比較高的信息,構建一個正確性相對比較高的地理信息庫,在當今地理信息位置服務方面變得十分必要,一個基于多因子計算區劃的可信度的方法隨著用戶的需要而產生。
傳統的方法通常采用基于關鍵詞的精確或模糊匹配方法,這對于大規?;虼蠓秶牡孛刂窋祿?,不僅查找的速度慢,很難滿足網絡地圖在線快速服務的需要,也沒有顧及地址的語義信息,導致查找的準確性較低,查找結果多樣且往往不是用戶所需要的結果。例如,當用戶在互聯網上查找“湖北武漢洪山江蘇省鼓樓區”時,期望的結果應該是返回“湖北省武漢市洪山區”,但是普通的方法可能會返回“江蘇省鼓樓區”、“福建省鼓樓區”。
發明內容
針對上述現有技術中的不足,本發明的目的在于提供一種基于多因子的行政區劃的可信度計算的方法,通過移動窗口最大匹配算法,并顧及地址的語義建立用于地址匹配的語義庫或知識庫,然后根據地址數據表達的語義特點,通過適當的匹配算法提高地址檢索的速度和準確性。
本發明為達到上述目的所采取的技術方案為:一種基于多因子計算行政區劃的可信度的方法,其特征在于:它包括以下步驟:
S1、對一個待查詢地址字符串,計算位置查詢因子:
根據行政區劃表,對待查詢地址字符串進行分詞,得到若干個行政區劃字符串,每個行政區劃字符串根據其獲得方式預設一個系數;計算每個行政區劃字符串在待查詢地址字符串中的位置,從左到右依次按數字從小到大排序,該數字即為該行政區劃字符串對應的位置值,計算所有行政區劃字符串的位置值的和;
將位置值除以所有行政區劃字符串的位置值的和,得到的結果反序排列,依次作為各行政區劃字符串的位置因子;
各行政區劃字符串的位置因子乘以其預設的系數,即為位置查詢因子;
S2、根據該待查詢地址字符串所有可能的行政區劃結果集,計算區劃位置級差因子、區劃相關因子和區劃級差相關因子:
行政區劃結果集包含若干個行政區劃結果,每個行政區劃結果由S1中得到的行政區劃字符串,以及其父行政區劃字符串構成,其中父行政區劃字符串包括該行政區劃字符串的上一級、直至最高級行政區劃字符串;每個行政區劃字符串及其父行政區劃字符串都有相應的行政區劃級別;
以每個行政區劃結果中S1中得到的行政區劃字符串為待計算對象,兩兩之間的級別差加1,乘以兩兩之間的位置值差加1,得到兩兩之間的區劃位置級差因子;
以每個行政區劃結果中S1中得到的行政區劃字符串為待計算對象,判斷兩兩之間是否有包含關系,若有則區劃相關因子為1,若無則區劃相關因子為0;
對應的兩兩之間的區劃位置級差因子與區劃相關因子的乘積,即為兩兩之間的區劃級差相關因子;
S3、根據兩兩之間的區劃級差相關因子,獲得某行政區劃字符串與所有其它行政區劃字符串之間的區劃級差相關因子的和,乘以該行政區劃字符串的位置查詢因子,即為該行政區劃字符串的可信度,取最大可信度對應的行政區劃字符串所在的行政區劃結果。
本發明的有益效果為:利用已知的或由其它方法獲得的對待查詢地址字符串的分詞結果及所有可能的行政區劃結果集,顧及地址的語義建立用于地址匹配的語義庫或知識庫,然后根據地址數據表達的語義特點,通過適當的匹配算法提高地址檢索的速度和準確性;該方法能夠有效提高地址數據查找的準確性,從而提高網絡地圖在線服務質量,從而為用戶更好的定位。
具體實施方式
下面結合具體實例對本發明作進一步說明。
本發明提供一種基于多因子的行政區劃的可信度計算的方法,包括以下步驟:
S1、對一個待查詢地址字符串,計算位置查詢因子:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于武漢工程大學,未經武漢工程大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510093347.X/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:谷種丸?;|及加工谷種丸粒的方法
- 下一篇:酒盒鉚孔用支撐架





