[發明專利]指代消解的方法、裝置及電子設備有效
| 申請號: | 202010113756.2 | 申請日: | 2020-02-24 |
| 公開(公告)號: | CN113297843B | 公開(公告)日: | 2023-01-13 |
| 發明(設計)人: | 劉通;祝官文;孟函可 | 申請(專利權)人: | 華為技術有限公司 |
| 主分類號: | G06F40/284 | 分類號: | G06F40/284;G06F40/289;G06N3/04;G06N3/08 |
| 代理公司: | 深圳中一聯合知識產權代理有限公司 44414 | 代理人: | 左婷蘭 |
| 地址: | 518129 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 指代 消解 方法 裝置 電子設備 | ||
本申請適用于人工智能技術領域,提供了一種指代消解的方法及裝置,所述方法包括:獲取待指代消解的目標文本;獲取所述目標文本的詞義特征,獲取所述目標文本的詞性特征,位置特征和知識特征中的至少一個目標特征;將所述詞義特征和所述目標特征組成輸入矩陣;將所述輸入矩陣輸入神經網絡模型,得到指代消解結果。本申請增加了神經網絡模型輸入數據的信息種類,從而提高了指代消解結果的準確性。
技術領域
本申請屬于自然語言處理技術領域,尤其涉及一種指代消解的方法、裝置及電子設備。
背景技術
自然語言是人類智慧的結晶。雖然自然語言處理是人工智能中最為困難的問題之一,但是對自然語言處理的研究一直都是熱點。
指代作為一種常見的語言現象,廣泛存在于自然語言表達中。然而,指代增加了自然語言處理的難度。指代消解是指明確代詞與先行詞的指代關系的任務。指代消解對信息抽取、對話系統、機器翻譯以及機器閱讀理解等自然語言處理的應用場景都有極為重要的支撐作用。例如,指代消解用于對話系統中,可以將代詞替換為所對應的先行詞,從而提高對話意圖識別與要素抽取的準確性。
指代消解一般來說包括兩種:顯性代詞消解和零代詞消解。顯性代詞消解是指在表達中確定顯式代詞指向哪個名詞短語。零代詞消解是針對零指代現象的一類特殊的消解,零代詞消解根據上下文關系推斷出省略部分,即零代詞,指代前文哪個語言學單位。本申請文件所述指代消解均指顯性代詞消解。
傳統的指代消解技術是根據句法分析、詞性標注和實體抽取,并結合人工規則集,對代詞進行消解,這種方法費時費力,不具有泛化能力。
近年來,隨著人工智能和深度學習技術的不斷突破,很多自然語言處理任務逐漸采用深度學習架構來處理。與傳統技術不同的是,深度學習方法是使用神經網絡架構,通過大量語料進行訓練,學習到詞與詞之間的語義相關程度,根據相關程度對代詞進行消解。
發明內容
本申請實施例提供了指代消解的方法及裝置,可以解決相關技術中指代消解的準確度不夠的問題。
第一方面,本申請實施例提供了一種指代消解的方法,該方法包括:獲取需要進行指代消解的目標文本后,獲取所述目標文本的詞義特征,獲取所述目標文本的詞性特征,位置特征和知識特征中的至少一個;再將獲取到的不同種類的特征組成輸入矩陣后輸入神經網絡模型,得到指代消解結果。
第一方面的實施例中,輸入神經網絡模型的信息,除了詞義特征外,還增加了詞性特征,位置特征和知識特征中的至少一個,增加了神經網絡模型輸入數據的信息種類,從而提高了指代消解結果的準確度。
在第一方面的一種可能的實現方式中,所述詞義特征包括所述目標文本對應的詞向量矩陣。
在第一方面的一種可能的實現方式中,所述獲取所述目標文本的詞義特征,包括:
將每個分詞轉換成詞向量,所述目標文本包括若干個所述分詞;
將各個所述分詞對應的詞向量拼接成詞向量矩陣。
在第一方面的一種可能的實現方式中,獲取所述目標文本的詞性特征,包括:
獲取每個分詞對應的詞性信息,所述目標文本包括若干個所述分詞;
將每個所述分詞對應的所述詞性信息,映射成詞性特征。
在第一方面的一種可能的實現方式中,獲取所述目標文本的位置特征,包括:
獲取每個分詞對應的位置信息,所述目標文本包括若干個所述分詞;
將每個所述分詞對應的所述位置信息,映射成位置特征。
在第一方面的一種可能的實現方式中,獲取所述目標文本的知識特征,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華為技術有限公司,未經華為技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010113756.2/2.html,轉載請聲明來源鉆瓜專利網。





