[發明專利]代詞消解方法、裝置、電子設備及存儲介質有效
| 申請號: | 202110283477.5 | 申請日: | 2021-03-17 |
| 公開(公告)號: | CN112765958B | 公開(公告)日: | 2023-07-04 |
| 發明(設計)人: | 祝大偉;陳立 | 申請(專利權)人: | 中國平安人壽保險股份有限公司 |
| 主分類號: | G06F40/211 | 分類號: | G06F40/211;G06F40/295 |
| 代理公司: | 深圳市沃德知識產權代理事務所(普通合伙) 44347 | 代理人: | 高杰;于志光 |
| 地址: | 518000 廣東省深圳市福田區益田路5033號*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 代詞 消解 方法 裝置 電子設備 存儲 介質 | ||
本發明涉及語音語義領域,揭露了一種代詞消解方法,包括:獲取對話數據,劃分所述對話數據中的上下文語句;標記所述上下文語句中實體及代詞的對應關系,生成標準實體?代詞對應關系;利用所述上下文語句和所述標準實體?代詞對應關系對代詞實體消解模型進行訓練,得到訓練完成的代詞實體消解模型;利用所述訓練完成的代詞實體消解模型對待消解實體?代詞關系的對話數據進行實體?代詞關系消解,得到消解結果。本發明還提出一種代詞消解裝置、電子設備及計算機可讀存儲介質。此外,本發明還涉及區塊鏈技術,所述上下文語句可存儲于區塊鏈中。本發明可以降低代詞消解的復雜度。
技術領域
本發明涉及語音語義領域,尤其涉及一種代詞消解方法、裝置、電子設備及計算機可讀存儲介質。
背景技術
在日常生活中,人們對話過程中往往會出現某個語句關系中的實體(Entity)以指稱(Mention)的形式出現或省略。為了更準確的理解對話信息,需要進行代詞消解。所述指代消解是將代表同一實體(Entity)的不同指稱(Mention)劃分到一個等價集合(指代鏈,Coreference?Chain)的過程。指代消解能夠有效解決文本當中的指代不明問題。
現有的指代消解方法主要基于指代消歧的方法,識別對話中所有的代詞和實體,判斷其中的代詞是否有指向的實體、找到代詞最有可能的指代實體,最后將代詞用找到的實體替換,從而實現指代消解,但這種方法需要計算對話中每一個指代詞和所有實體之間的關系,導致其計算復雜度較高。
發明內容
本發明提供一種代詞消解方法、裝置、電子設備及計算機可讀存儲介質,其主要目的在于降低代詞消解的復雜度。
為實現上述目的,本發明提供的一種代詞消解方法,包括:
獲取對話數據,劃分所述對話數據中的上下文語句;
標記所述上下文語句中實體及代詞的對應關系,生成標準實體-代詞對應關系;
利用代詞實體消解模型中的編碼層對所述上下文語句中字符進行位置向量編碼,生成上下文字符向量;
利用所述代詞實體消解模型中的前饋注意力機制對所述上下文字符向量進行特征序列提取,得到上下文特征字符向量;
利用所述代詞實體消解模型中實體-代詞關系消解模塊對所述上下文特征字符向量進行實體-代詞關系識別,得到預測實體-代詞對應關系;
利用所述代詞實體消解模型中損失函數計算所述預測實體-代詞對應關系與所述標準實體-代詞對應關系的損失值;
當所述損失值不滿足預設條件時,調整所述代詞實體消解模型的參數,并返回利用代詞實體消解模型中的編碼層對所述上下文語句中字符進行位置向量編碼的步驟及后續步驟;
當所述損失值滿足預設條件時,得到訓練完成的代詞實體消解模型;
利用所述訓練完成的代詞實體消解模型對待消解實體-代詞關系的對話數據進行實體-代詞關系消解,得到消解結果。
可選地,所述劃分所述對話數據中的上下文語句,包括:
獲取所述對話數據的語句時間,根據所述語句時間,利用預設的上下文語句劃分腳本對所述對話數據進行順序語句標記,得到上下文語句。
可選地,所述對標記所述上下文語句中實體及代詞的對應關系,生成標準實體-代詞對應關系,包括:
構建所述上下文語句的數據結構;
根據所述數據結構,利用預設的指針對所述上下文語句進行實體-代詞對應關系標記,得到標準實體-代詞對應關系。
可選地,所述利用代詞實體消解模型中的編碼層對所述上下文語句中字符進行位置向量編碼,生成上下文字符向量,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國平安人壽保險股份有限公司,未經中國平安人壽保險股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110283477.5/2.html,轉載請聲明來源鉆瓜專利網。





