[發明專利]一種目標實體鏈接方法、裝置、設備及存儲介質有效
申請號: | 201910388403.0 | 申請日: | 2019-05-10 |
公開(公告)號: | CN110147421B | 公開(公告)日: | 2022-06-21 |
發明(設計)人: | 吳坤 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
主分類號: | G06F16/29 | 分類號: | G06F16/29;G06F16/9537;G06F16/901;G06F16/903 |
代理公司: | 廣州三環專利商標代理有限公司 44202 | 代理人: | 郝傳鑫;賈允 |
地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
權利要求書: | 查看更多 | 說明書: | 查看更多 |
摘要: | |||
搜索關鍵詞: | 一種 目標 實體 鏈接 方法 裝置 設備 存儲 介質 | ||
本申請公開了一種目標實體鏈接方法、裝置、設備及存儲介質,所述方法包括:對目標實體文本信息進行多維度文本分析處理,得到包括詞信息和詞權重信息的多維度文本信息;基于詞信息從預設實體庫中確定候選實體文本信息,預設實體庫包括實體文本信息的詞信息和詞權重信息;將目標實體文本信息的詞信息、詞權重信息和候選實體文本信息的詞信息、詞權重信息輸入語義關聯模型進行語義關聯,得到關聯實體文本信息;將關聯實體文本信息作為目標實體文本信息的鏈接實體文本信息。利用本申請通過的技術方案可以提高對實體文本信息的表征能力,進而提高確定的鏈接實體文本信息的準確性,基于該鏈接實體文本信息可以成功的實現目標實體的實體鏈接。
技術領域
本申請涉及計算機技術領域,尤其涉及一種目標實體鏈接方法、裝置、設備及存儲介質。
背景技術
POI(Point of interest,興趣點)是地理信息系統中收集的地理信息表現形式,可以是一棟建筑物、一個商家、一個郵筒或者一個公交站等。每個POI實體的屬性信息一般可以包括實體文本信息和地址信息。POI實體鏈接是指將地址文本中的POI實體文本信息鏈向POI實體庫中實體文本信息,進而獲取準確的地址信息的過程,在自然語言處理、信息檢索等領域有著廣泛的應用前景。
現有的POI實體鏈接技術大多采用計算文本相似度和候選排序的方案,具體的,可以根據目標實體文本信息的分詞信息構建關鍵詞;然后,通過關鍵詞召回相關實體文本信息;接著,基于目標實體文本信息與相關實體文本信息間文本的相似度由高到低進行排序;選取排序最靠前的相關實體文本信息作為目標實體文本信息的鏈接實體文本信息,進而獲取到目標實體文本信息的地址信息。但是上述現有的方案中僅僅考慮了實體文本信息間的文本相似度,往往無法準確的判斷實體文本信息是否對應同一實體,這樣就會導致鏈接的錯誤,并沒有很好的解決實體歧義的問題,準確率較低。因此,需要提供更可靠或更有效的方案。
發明內容
本申請提供了一種目標實體鏈接方法、裝置、設備及存儲介質,可以提高對實體文本信息的表征能力,進而提高確定的鏈接實體文本信息的準確性,基于該鏈接實體文本信息可以成功的實現目標實體的實體鏈接。
一方面,本申請提供了一種目標實體鏈接方法,所述方法包括:
對目標實體文本信息進行多維度文本分析處理,得到多維度文本信息,所述多維度文本信息包括詞信息和詞權重信息;
基于所述詞信息從預設實體庫中確定所述目標實體文本信息的候選實體文本信息,所述預設實體庫包括實體文本信息的詞信息和詞權重信息;
將所述目標實體文本信息的詞信息、詞權重信息和所述候選實體文本信息的詞信息、詞權重信息輸入語義關聯模型進行語義關聯,得到所述目標實體文本信息的關聯實體文本信息;
將所述關聯實體文本信息作為所述目標實體文本信息的鏈接實體文本信息。
另一方面提供了一種目標實體鏈接裝置,所述裝置包括:
多維度文本分析處理模塊,用于對目標實體文本信息進行多維度文本分析處理,得到多維度文本信息,所述多維度文本信息包括詞信息和詞權重信息;
候選實體文本信息確定模塊,用于基于所述詞信息從預設實體庫中確定所述目標實體文本信息的候選實體文本信息,所述預設實體庫包括實體文本信息的詞信息和詞權重信息;
語義關聯模塊,用于將所述目標實體文本信息的詞信息、詞權重信息和所述候選實體文本信息的詞信息、詞權重信息輸入語義關聯模型進行語義關聯,得到所述目標實體文本信息的關聯實體文本信息;
鏈接實體文本信息確定模塊,用于將所述關聯實體文本信息作為所述目標實體文本信息的鏈接實體文本信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910388403.0/2.html,轉載請聲明來源鉆瓜專利網。