[發明專利]地址標識的確定方法和裝置、存儲介質、電子裝置有效
| 申請號: | 201711269931.1 | 申請日: | 2017-12-05 |
| 公開(公告)號: | CN110019617B | 公開(公告)日: | 2022-05-20 |
| 發明(設計)人: | 孫福寧;章云龍;楊增奎;孟凡超 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F16/29 | 分類號: | G06F16/29;G06F16/332;G06F16/36;G06F16/9537 |
| 代理公司: | 北京康信知識產權代理有限責任公司 11240 | 代理人: | 趙囡囡 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 地址 標識 確定 方法 裝置 存儲 介質 電子 | ||
本發明公開了一種地址標識的確定方法和裝置、存儲介質、電子裝置。其中,該方法包括:接收第一請求,第一請求用于請求確定第一地址信息中表示地址的詞語的地址標識;響應于第一請求,對第一地址信息中的詞語進行識別;根據第一關系確定第一集合中第一詞語的地址標識,并根據與第一詞語的第二關系確定第一集合中第二詞語的地址標識,第一關系用于指示預先確定的詞語與地址標識之間的對應關系,第一詞語為在第一集合中與第二詞語相鄰的詞語,預先確定的詞語包括第一詞語、但不包括第二詞語。本發明解決了相關技術中對地址文本進行地址角色標注的準確率較低的技術問題。
技術領域
本發明涉及互聯網領域,具體而言,涉及一種地址標識的確定方法和裝置、存儲介質、電子裝置。
背景技術
在對運單數據做處理時,對于運單地址各詞語的成分識別,通常是由各處理模塊利用各自積累的詞表進行匹配識別,而對于地址文本中各詞語的切分,主要還是采用基礎分詞模塊,以詞的形式出現,不直接代表地址角色的含義。
上述方案存在對地址文本中詞語的地址角色進行批注的準確率較低的問題,主要原因在于:1)地址文本數據處理的各環節對語義語用的理解不統一,各環節積累的詞表通用性差、重復度高且可維護性差。而出于特定環節需求挖掘的詞表,因缺乏系統性,所以覆蓋率低。因此,基于已有詞表匹配識別語義的召回率和精度都不夠理想;2)使用傳統的詞表匹配方式識別語義角色,會出現多義或多角色詞同屬不同詞表時,難以消歧的情況。
針對相關技術中對地址文本進行地址角色標注的準確率較低的技術問題,目前尚未提出有效的解決方案。
發明內容
本發明實施例提供了一種地址標識的確定方法和裝置、存儲介質、電子裝置,以至少解決相關技術中對地址文本進行地址角色標注的準確率較低的技術問題。
根據本發明實施例的一個方面,提供了一種地址標識的確定方法,該方法包括:接收第一請求,第一請求用于請求確定第一地址信息中表示地址的詞語的地址標識;響應于第一請求,對第一地址信息中的詞語進行識別,得到第一集合,第一集合中的詞語按照在第一地址信息中的位置順序排列;根據第一關系確定第一集合中第一詞語的地址標識,并根據與第一詞語的第二關系確定第一集合中第二詞語的地址標識,第一關系用于指示預先確定的詞語與地址標識之間的對應關系,第一詞語為在第一集合中與第二詞語相鄰的詞語,預先確定的詞語包括第一詞語、但不包括第二詞語。
根據本發明實施例的另一方面,還提供了一種地址標識的確定裝置,該裝置包括:接收單元,用于接收第一請求,第一請求用于請求確定第一地址信息中表示地址的詞語的地址標識;響應單元,用于響應于第一請求,對第一地址信息中的詞語進行識別,得到第一集合,第一集合中的詞語按照在第一地址信息中的位置順序排列;確定單元,用于根據第一關系確定第一集合中第一詞語的地址標識,并根據與第一詞語的第二關系確定第一集合中第二詞語的地址標識,第一關系用于指示預先確定的詞語與地址標識之間的對應關系,第一詞語為在第一集合中與第二詞語相鄰的詞語,預先確定的詞語包括第一詞語、但不包括第二詞語。
根據本發明實施例的另一方面,還提供了一種存儲介質,該存儲介質包括存儲的程序,程序運行時執行上述的方法。
根據本發明實施例的另一方面,還提供了一種電子裝置,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,處理器通過計算機程序執行上述的方法。
在本發明實施例中,接收第一請求,第一請求用于請求確定第一地址信息中表示地址的詞語的地址標識;響應于第一請求,對第一地址信息中的詞語進行識別,得到第一集合,第一集合中的詞語按照在第一地址信息中的位置順序排列;根據第一關系確定第一集合中第一詞語的地址標識,并根據與第一詞語的第二關系確定第一集合中第二詞語的地址標識,第一關系用于指示預先確定的詞語與地址標識之間的對應關系,第一詞語為在第一集合中與第二詞語相鄰的詞語,預先確定的詞語包括第一詞語、但不包括第二詞語,進而解決了相關技術中對地址文本進行地址角色標注的準確率較低的技術問題。
附圖說明
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711269931.1/2.html,轉載請聲明來源鉆瓜專利網。





