[發(fā)明專利]一種地名識別方法和裝置有效
| 申請?zhí)枺?/td> | 201110458103.9 | 申請日: | 2011-12-30 |
| 公開(公告)號: | CN103186524A | 公開(公告)日: | 2013-07-03 |
| 發(fā)明(設(shè)計)人: | 鄧小波 | 申請(專利權(quán))人: | 高德軟件有限公司 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27 |
| 代理公司: | 北京集佳知識產(chǎn)權(quán)代理有限公司 11227 | 代理人: | 逯長明 |
| 地址: | 102200 北京市昌*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 地名 識別 方法 裝置 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及文字信息處理領(lǐng)域,特別涉及一種地名識別方法和裝置。
背景技術(shù)
隨著網(wǎng)絡(luò)技術(shù)的發(fā)展,人們可以自由地獲取大量的信息。然而對海量的信息資源,如何利用設(shè)備自動獲取有效的信息,是需要進(jìn)行技術(shù)研究。而如何通過對文字文本內(nèi)容的分析處理,從中提取需要的信息則無疑將推進(jìn)信息的有效利用。從文字文本中識別地名,進(jìn)而提取出地名則是其中重要的一個應(yīng)用方向。
文本信息中包含地名的場景很多,例如:在日常交流的手機(jī)短信中就存在大量地名;網(wǎng)購過程中商家將地址發(fā)送到用戶手機(jī)上;企業(yè)通知求職者面試時將面試詳細(xì)地址發(fā)送到求職者的手機(jī)上;還有朋友之間通過短信傳播的聚會地點(diǎn)等等。
識別的地名進(jìn)一步的應(yīng)用則會方便人們的生活,例如:將手機(jī)上的地址直觀地在地圖上展示,并提供路徑規(guī)劃、導(dǎo)航服務(wù)。這些應(yīng)用均需要基于地名識別才可以實現(xiàn)。
發(fā)明內(nèi)容
本發(fā)明實施例提供了一種地名識別方法和裝置,用以進(jìn)行地名識別。
一種地名識別方法,包括:
對待識別的字符串進(jìn)行分詞得到候選詞;
獲取各候選詞在地址名稱庫中的所屬類別;
對各候選詞進(jìn)行遍歷,若當(dāng)前候選詞的所屬類別為第一類別,則將當(dāng)前候選詞作為地名添加到候選地名集合;
若當(dāng)前候選詞的所屬類別為第二類別,則對當(dāng)前候選詞以及在所述地址名稱庫中與當(dāng)前候選詞臨近的候選詞進(jìn)行組合得到合成詞,并將所述合成詞作為地名添加到候選地名集合。
一種地名識別裝置,包括:
分詞單元,用于對待識別的字符串進(jìn)行分詞得到候選詞;
類別獲取單元,用于獲取各候選詞在地址名稱庫中的所屬類別;
地名識別單元,用于對各候選詞進(jìn)行遍歷,若當(dāng)前候選詞的所屬類別為第一類別,則將當(dāng)前候選詞作為地名添加到候選地名集合;若當(dāng)前候選詞的所屬類別為第二類別,則對當(dāng)前候選詞以及在所述地址名稱庫中與當(dāng)前候選詞臨近的候選詞進(jìn)行組合得到合成詞,并將所述合成詞作為地名添加到候選地名集合。
從以上技術(shù)方案可以看出,使用本發(fā)明實施例方案:
通過對待識別的字符串進(jìn)行分詞得到候選詞;獲取各候選詞在地址名稱庫中的所屬類別;當(dāng)某個候選詞為第一類別時,則直接將該候選詞作為地名加入候選地名集合,則完成該候選詞的地名識別,而當(dāng)某個候選詞為第二類別時,需要對該候選詞以及在地址名稱庫中與當(dāng)前候選詞臨近的候選詞進(jìn)行組合得到合成詞,則完成地名識別,所以,分詞得到候選詞之后,可以根據(jù)候選詞的所屬類別及與其臨近并且屬于地址名稱庫中的候選詞進(jìn)行相應(yīng)的處理,從而能夠進(jìn)行地名識別。
附圖說明
為了更清楚地說明本發(fā)明實施例中的技術(shù)方案,下面將對實施例描述中所需要使用的附圖作簡要介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng)域的普通技術(shù)人員來講,在不付出創(chuàng)造性勞動性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1為本發(fā)明實施例地名識別方法一個實施例示意圖;
圖2為本發(fā)明實施例地名識別方法另一實施例示意圖;
圖3為地名修正對比示意圖;
圖4為本發(fā)明實施例地名識別裝置一個實施例示意圖;
圖5為本發(fā)明實施例地名識別裝置另一實施例示意圖;
圖6為本發(fā)明實施例地名識別裝置另一實施例示意圖;
圖7為本發(fā)明實施例地名識別裝置另一實施例示意圖;
圖8為本發(fā)明實施例地名識別裝置另一實施例示意圖;
圖9為本發(fā)明實施例地名識別裝置另一實施例示意圖;
圖10為本發(fā)明實施例地名識別裝置另一實施例示意圖;
圖11為本發(fā)明實施例地名識別裝置另一實施例示意圖。
具體實施方式
為了使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合附圖對本發(fā)明作進(jìn)一步地詳細(xì)描述,顯然,所描述的實施例僅僅是本發(fā)明一部份實施例,而不是全部的實施例。基于本發(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其它實施例,都屬于本發(fā)明保護(hù)的范圍。
本發(fā)明實施例提供了一種地名識別方法,如圖1所示,包括:
101、對待識別的字符串進(jìn)行分詞得到候選詞;
本實施例中,當(dāng)?shù)孛R別裝置需要進(jìn)行地名識別時,可以先獲取到待識別的字符串,該字符串的來源可以是包含文字的任何文本,例如:短信、網(wǎng)頁頁面等,可以理解的是,在實際應(yīng)用中,除了上述限定的來源之外,該字符串還可以從其他方式獲取,具體此處不做限定。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于高德軟件有限公司,未經(jīng)高德軟件有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110458103.9/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種顯示波形的軟件濾波方法
- 下一篇:雙向排版方法和設(shè)備





