[發明專利]多輪對話系統的指代消解方法有效
| 申請號: | 202011042444.3 | 申請日: | 2020-09-28 |
| 公開(公告)號: | CN112183060B | 公開(公告)日: | 2022-05-10 |
| 發明(設計)人: | 張會焱;敖文剛;劉宗敏 | 申請(專利權)人: | 重慶工商大學 |
| 主分類號: | G06F40/211 | 分類號: | G06F40/211;G06F40/216;G06F40/284;G06F40/295;G06F40/30;G06F16/35;G06N3/04;G06N3/08;G10L15/22 |
| 代理公司: | 北京海虹嘉誠知識產權代理有限公司 11129 | 代理人: | 呂小琴 |
| 地址: | 400067 *** | 國省代碼: | 重慶;50 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 輪對 系統 指代 消解 方法 | ||
1.一種多輪對話系統的指代消解方法,其特征在于:包括以下步驟:
S1.對多輪對話系統所接收到的語句進行檢測,判斷語句是否需要進行指代消解,如是,則進入到步驟S2中;
S2.對確定為需要進行指代消解的語句進行判斷,區分語句的指代類型,并從區分出指代類型的語句中篩選出候選實體;
S3.確定候選實體與語句中指代詞的距離,并將距離最小的候選實體作為指代鏈接詞;
S4.將指代詞更新為指代鏈接詞;
步驟S3中,根據如下方法確定候選實體與語句中指代詞的距離:
D=α*(w1*D1+w2*D2);其中,D為候選實體與語句中指代詞的距離,α為實體類型與待消解語句的類型匹配度,w1為實體與語句話題關聯度系數,w2為實體替換后的句子概率系數,D1為待指代消解的語句的句向量和候選實體之間的語義距離,D2為候選實體與待指代消解語句之間的距離;
根據如下方法計算類型匹配度α:
其中,PL為指代詞的指代類型的預測概率,Pm為候選實體內第m個字的字標簽屬性概率,k為候選實體中字的個數;
根據如下方法計算實體與語句話題關聯度系數w1:
w1=Pt;其中,Pt為當前語句的話題的前一個話題轉移到當前語句的話題的概率;
所述實體替換后的句子概率系數w2計算方法為:
w2=P(s1)∏i≥2P(si|si-1),其中:P(s1)為待消解語句中編號為1的詞s1排在待消解語句句首的概率,P(si|si-1)為待消解語句的第i個詞si排在第i-1個詞si-1個詞后的概率;
根據如下方法確定待指代消解的語句的句向量和候選實體之間的語義距離D1:
其中,Vsen為待消解語句的句向量,Vcdt為候選實體向量,
n表示組成待消解語句的詞的個數,r表示組成待消解語句的第r個詞,q為組成候選實體的詞的個數,j為組成候選實體的第j個詞,vr為組成待消解語句的第r個詞的詞向量,vj為組成候選實體第j個詞的詞向量;
根據如下方法確定候選實體與指代句之間的距離D2:
D2=eU-V,其中,U為候選實體出現的次數,V為候選實體與待消解的語句之間的間隔字符數。
2.根據權利要求1所述多輪對話系統的指代消解方法,其特征在于:步驟S1和步驟S2中,采用fasttext分類模型對語句進行檢測并提取出指代詞,并對語句的指代類型進行判斷。
3.根據權利要求1所述多輪對話系統的指代消解方法,其特征在于:步驟S2中,采用BiLSTM_CRF深度學習模型對語句中的實體進行提取。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于重慶工商大學,未經重慶工商大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011042444.3/1.html,轉載請聲明來源鉆瓜專利網。





