[發(fā)明專利]一種用于興趣點信息的排重方法有效
| 申請?zhí)枺?/td> | 201210153313.1 | 申請日: | 2012-05-17 |
| 公開(公告)號: | CN102682128B | 公開(公告)日: | 2017-08-29 |
| 發(fā)明(設(shè)計)人: | 呂崇毅;程行榮;余小峰;謝燕玲;余順麗 | 申請(專利權(quán))人: | 廈門雅迅網(wǎng)絡(luò)股份有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 泉州市誠得知識產(chǎn)權(quán)代理事務(wù)所(普通合伙)35209 | 代理人: | 方惠春 |
| 地址: | 361000 福建*** | 國省代碼: | 福建;35 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 用于 興趣 信息 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及信息排重技術(shù),具體涉及一種用于興趣點信息的排重方法。
背景技術(shù)
隨著電子地圖導(dǎo)航(GIS)技術(shù)的普及,電子地圖中引進了政府機關(guān)、觀光景點、賓館、餐廳、商場以及醫(yī)院等人們感興趣的地點的名稱、簡介等數(shù)據(jù),這些人們感興趣的地點稱為興趣點(Point of Interest),而這些地點的名稱、簡介等數(shù)據(jù)信息統(tǒng)稱為興趣點信息。
人們在使用電子地圖時,可以附帶地獲得相應(yīng)的興趣點信息,興趣點信息一般包括興趣點的名稱、類型、所在經(jīng)緯度、詳細地址、聯(lián)系電話等等。在采集保存興趣點過程中,為了保證興趣點信息合法性、可靠性、有效性以及提高唯一性(減少數(shù)據(jù)冗余),必須對采集到的數(shù)據(jù)進行處理。例如,本公司申請的另外一篇申請公布號為CN 102054010A、申請?zhí)枮?00910309256.X、名稱為“一種興趣點信息處理方法”的發(fā)明,公開了一種興趣點信息處理方法,該發(fā)明的方法包含建立數(shù)據(jù)庫、注冊、保存興趣點信息和使用興趣點信息的過程。其中保存興趣點信息的過程中:使用者操作終端按應(yīng)用模板將一個興趣點的位置、名稱、類型、簡介和附加信息編輯成記錄素材,并上傳給中心;中心按該記錄素材中的位置所在的地域?qū)⒃撚涗浰夭募捌渥R別碼存入所述數(shù)據(jù)庫該地域的興趣點文件;中心檢查該記錄素材的發(fā)出者是否在黑名單中,是則退出;中心操作員審查該記錄素材的合法性;不合法的,中心將該記錄素材發(fā)出者記入黑名單中;合法的,中心將該記錄素材修改為興趣點記錄。該發(fā)明的方法在保證興趣點信息的合法性和可靠性的同時提高了興趣點信息采集和輸入的數(shù)量,并加快了對興趣點信息更新的速度,但是上述方法只專注于提高興趣點信息的采集和輸入的數(shù)量,而并沒有針對興趣點信息進行減少數(shù)據(jù)冗余以提高唯一性的處理。
目前針對信息的數(shù)據(jù)冗余處理通常是采用排重技術(shù),現(xiàn)有的排重技術(shù)主要是運用字符串全匹配或者局部匹配、分詞匹配進行判斷。而由于興趣點信息在采集中,要求信息比較詳細,且上傳的名稱和地址等信息比較準確,因而現(xiàn)有所使用的全匹配或分詞匹配方法,都無法滿足比較精確的排除數(shù)據(jù)冗余的需求,例如采集人員輸入字符串“沃爾碼”,而實際已有的數(shù)據(jù)為“沃爾瑪”或“沃爾瑪購物廣場”,通過全匹配和分詞匹配都無法通過比較得出該數(shù)據(jù)為冗余數(shù)據(jù)的結(jié)果。
發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問題是,提出一種用于興趣點信息的排重方法,以位置為基礎(chǔ),結(jié)合一種根據(jù)采集的興趣點信息進行位置偏移匹配的方法,來實現(xiàn)區(qū)域范圍內(nèi)高匹配度的排重方法,從而解決現(xiàn)有排重技術(shù)無法實現(xiàn)的高精度排除數(shù)據(jù)冗余的問題。
為了解決上述技術(shù)問題,本發(fā)明所采用的技術(shù)方案是,一種用于興趣點信息的排重方法,包括以下步驟:
步驟1:系統(tǒng)接收到上傳的興趣點A的信息并保存,該信息內(nèi)容至少包括興趣點名稱、興趣點類型、經(jīng)緯度、地址和簡介;
步驟2:以步驟1保存的興趣點A的經(jīng)緯度為基準點,查詢現(xiàn)有數(shù)據(jù)集合中的以該興趣點A為中心的、封閉的第一區(qū)域范圍內(nèi)的所有興趣點名稱;
步驟3:根據(jù)位置偏移匹配方法,對興趣點A的名稱和搜索到的其他各興趣點名稱進行匹配排重,得到排重結(jié)果以及匹配精度;
步驟4:如果步驟3得到的匹配精度P1≥預(yù)先設(shè)定的精度P,則結(jié)束排重并轉(zhuǎn)到步驟9,否則,轉(zhuǎn)到步驟5;其中0<P<100%;
步驟5:以興趣點A的經(jīng)緯度為基準點,查詢現(xiàn)有數(shù)據(jù)集合中的以該興趣點A為中心的、覆蓋第一區(qū)域范圍外的、封閉的第二區(qū)域范圍內(nèi)的所有興趣點名稱,重復(fù)步驟3;
步驟6:如果步驟5得到的匹配精度P2≥預(yù)先設(shè)定的精度P’,則結(jié)束排重并轉(zhuǎn)到步驟9,否則,轉(zhuǎn)到步驟7;其中0<P’<100%,P’>P;
步驟7:以興趣點A的經(jīng)緯度為基準點,查詢現(xiàn)有數(shù)據(jù)集合中的以該興趣點A為中心、覆蓋第一區(qū)域和第二區(qū)域范圍外的、封閉的第三區(qū)域范圍內(nèi)的所有興趣點名稱,重復(fù)步驟3;
步驟8:如果步驟7得到的匹配精度P3≥預(yù)先設(shè)定的精度P’’,則結(jié)束排重并轉(zhuǎn)到步驟9,否則,輸出:在第一區(qū)域、第二區(qū)域和第三區(qū)域范圍內(nèi)沒有找到匹配結(jié)果;其中0<P’’<100%,P’’>P’;
步驟9:輸出排重結(jié)果。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廈門雅迅網(wǎng)絡(luò)股份有限公司,未經(jīng)廈門雅迅網(wǎng)絡(luò)股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210153313.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 信息記錄介質(zhì)、信息記錄方法、信息記錄設(shè)備、信息再現(xiàn)方法和信息再現(xiàn)設(shè)備
- 信息記錄裝置、信息記錄方法、信息記錄介質(zhì)、信息復(fù)制裝置和信息復(fù)制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄設(shè)備、信息重放設(shè)備、信息記錄方法、信息重放方法、以及信息記錄介質(zhì)
- 信息存儲介質(zhì)、信息記錄方法、信息重放方法、信息記錄設(shè)備、以及信息重放設(shè)備
- 信息存儲介質(zhì)、信息記錄方法、信息回放方法、信息記錄設(shè)備和信息回放設(shè)備
- 信息記錄介質(zhì)、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置





