[發明專利]實體依存關系的確定方法及裝置有效
| 申請號: | 201910372285.4 | 申請日: | 2019-05-06 |
| 公開(公告)號: | CN110162788B | 公開(公告)日: | 2021-02-09 |
| 發明(設計)人: | 王卓然;亓超;馬宇馳;王東亮;陳華榮 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06F16/28 |
| 代理公司: | 深圳市深佳知識產權代理事務所(普通合伙) 44285 | 代理人: | 王仲凱 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 實體 依存 關系 確定 方法 裝置 | ||
本發明實施例提供一種實體依存關系的確定方法及裝置,所述方法包括:將待識別文本拆分成多個子文本;識別所述多個子文本中每個子文本中的實體;依據所述每個子文本中的實體和/或相鄰子文本中的實體的依存關系,確定所述待識別文本中實體之間的依存關系。可見,相比直接確定待識別文本中的所有實體之間的依存關系,采用本發明實施例中的實體依存關系的確定方法及裝置,在確定各實體之間的依存關系之前,先將待識別文本拆分為多個子文本,再依據每個子文本中的實體和/或相鄰子文本中的實體的依存關系,確定待識別文本中實體之間的依存關系,能夠避免將兩個子文本中無關的實體聯系在一起,提高確定文本中各實體之間的依存關系的準確性。
技術領域
本發明實施例涉及互聯網技術領域,尤其涉及實體依存關系的確定方法及裝置。
背景技術
現有技術中存在一種對從一段文本中識別出的命名實體(也叫實體,NER)進行顯示的方法,在該方法中單獨顯示每個命名實體。例如,對于“我去朝陽區小營路8號的七天酒店”這一文本,該文本中就存在“朝陽區小營路8號”、“七天酒店”這兩個實體,會在用戶終端中分別顯示這兩個實體對應的卡片,在一種可實現的方式中,為了改善用戶體驗,一般會將有依存關系的實體在一個卡片中顯示。
實現本發明實施例的過程中,發明人發現現有技術中對于內容較為復雜的文本,按照現有的文本識別技術往往無法準確地確定出文本中各實體之間的依存關系。例如:內容為“你去A地點的肯德基,我去B地點的麥當勞。”這一文本,從該文本中,能夠識別出“A地點、肯德基、B地點、麥當勞”這四個實體,對這四個實體進行依存關系分析,就有可能會得到A地點是描述麥當勞的,B地點是描述肯德基的這一結果,而實際上,A地點是描述肯德基的,B地點是描述麥當勞的,這樣在用戶進行卡片選定的后續操作時,不能獲取較準確的推薦。
發明內容
鑒于上述問題,本發明實施例的目的是提供一種實體依存關系的確定方法及裝置,能夠準確地確定出文本中各實體之間的依存關系。
第一方面,本發明實施例提供一種實體依存關系的確定方法,所述方法包括:將待識別文本拆分成多個子文本;識別所述多個子文本中每個子文本中的實體;依據所述每個子文本中的實體和/或相鄰子文本中的實體的依存關系,確定所述待識別文本中實體之間的依存關系。
第二方面,本發明實施例提供一種實體依存關系的確定裝置,所述裝置包括:拆分模塊,被配置為將待識別文本拆分成多個子文本;識別模塊,被配置為識別所述多個子文本中每個子文本中的實體;確定模塊,被配置為依據所述每個子文本中的實體和/或相鄰子文本中的實體的依存關系,確定所述待識別文本中實體之間的依存關系。
第三方面,本發明實施例提供一種電子設備,所述電子設備包括:至少一個處理器;以及與所述處理器連接的至少一個存儲器、總線;其中,所述處理器、存儲器通過所述總線完成相互間的通信;所述處理器用于調用所述存儲器中的程序指令,以執行上述一個或多個技術方案中的方法。
第四方面,本發明實施例提供一種計算機可讀存儲介質,所述存儲介質包括存儲的程序,其中,在所述程序運行時控制所述存儲介質所在設備執行上述一個或多個技術方案中的方法。
本發明實施例提供的實體依存關系的確定方法及裝置,在獲取待識別文本后,首先,將待識別文本拆分為多個子文本;然后,識別多個子文本中每個子文本中的實體;最后,依據每個子文本中的實體和/或相鄰子文本中的實體的依存關系,確定待識別文本中實體之間的依存關系。可見,相比直接確定待識別文本中的所有實體之間的依存關系,采用本發明實施例中的實體依存關系的確定方法及裝置,在確定各實體之間的依存關系之前,先將待識別文本拆分為多個子文本,再依據每個子文本中的實體和/或相鄰子文本中的實體的依存關系,確定待識別文本中實體之間的依存關系,能夠避免將兩個子文本中無關的實體聯系在一起,提高確定文本中各實體之間的依存關系的準確性。
附圖說明
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910372285.4/2.html,轉載請聲明來源鉆瓜專利網。





