[發明專利]多輪對話系統的指代消解方法有效
| 申請號: | 202011042444.3 | 申請日: | 2020-09-28 |
| 公開(公告)號: | CN112183060B | 公開(公告)日: | 2022-05-10 |
| 發明(設計)人: | 張會焱;敖文剛;劉宗敏 | 申請(專利權)人: | 重慶工商大學 |
| 主分類號: | G06F40/211 | 分類號: | G06F40/211;G06F40/216;G06F40/284;G06F40/295;G06F40/30;G06F16/35;G06N3/04;G06N3/08;G10L15/22 |
| 代理公司: | 北京海虹嘉誠知識產權代理有限公司 11129 | 代理人: | 呂小琴 |
| 地址: | 400067 *** | 國省代碼: | 重慶;50 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 輪對 系統 指代 消解 方法 | ||
本發明提供的一種多輪對話系統的指代消解方法,包括以下步驟:S1.對多輪對話系統所接收到的語句進行檢測,判斷語句是否需要進行指代消解,如是,則進入到步驟S2中;S2.對確定為需要進行指代消解的語句進行判斷,區分語句的指代類型,并從區分出指代類型的語句中篩選出候選實體;語句的指代類型包括回指語句和共指語句;S3.確定候選實體與語句中指代詞的距離,并將距離最小的候選實體作為指代鏈接詞;S4.將指代詞更新為指代鏈接詞;通過上述方法,能夠對輸入多輪對話系統的語句的指代進行準確的識別,并進行準確的指代消解,能有效提高多輪交互系統的順暢性,提升用戶體驗。
技術領域
本發明涉及人機對話語言處理領域,尤其涉及一種多輪對話系統的指代消解方法。
背景技術
指代是一種常見的語言現象。在多輪對話系統中,指代和省略影響人機對話系統的流暢度和用戶體驗。人腦具有知識背景和記憶能力,能夠很好的重現對話歷史的關鍵信息,自動補全或者替換對方當前輪的代詞,來理解對話的真正含義。同樣,人機對話系統中需要指代消解模塊,來理解用戶輸入的真正語義。
指代消解方法分為基于管道的方法和基于端到端的方法?;诠艿赖姆椒ㄊ窍冗M行指代檢測,然后再進行指代消解。基于端到端的方法,對輸入層編碼,通過中間層的計算,輸出指代消解結果,常見的基于端到端的方法有基于聯合訓練的方法、基于序列標注的方法、基于指針網絡的方法?;诙说蕉说姆椒ㄍǔ2捎蒙疃葘W習模型,但是需要大量帶標簽的標注數據,在面對領域數據缺乏時模型構建成本較高,尤其在初期是多輪指代消解標注數據缺乏,且在實際應用中遇到問題,模型修改迭代不滿足線上系統的及時性。
因此,為了解決上述技術問題,亟需提出一種新的技術手段加以解決。
發明內容
有鑒于此,本發明的目的是提供一種多輪對話系統的指代消解方法,能夠對輸入多輪對話系統的語句的指代進行準確的識別,并進行準確的指代消解,能有效提高多輪交互系統的順暢性,提升用戶體驗。
本發明提供的一種多輪對話系統的指代消解方法,包括以下步驟:
S1.對多輪對話系統所接收到的語句進行檢測,判斷語句是否需要進行指代消解,如是,則進入到步驟S2中;
S2.對確定為需要進行指代消解的語句進行判斷,區分語句的指代類型,并從區分出指代類型的語句中篩選出候選實體;
S3.確定候選實體與語句中指代詞的距離,并將距離最小的候選實體作為指代鏈接詞;
S4.將指代詞更新為指代鏈接詞。
進一步,步驟S3中,根據如下方法確定候選實體與語句中指代詞的距離:
D=α*(w1*D1+w2*D2);其中,D為候選實體與語句中指代詞的距離,α為實體類型與待消解語句的類型匹配度,w1為實體與語句話題關聯度系數,w2為實體替換后的句子概率系數,D1為待指代消解的語句的句向量和候選實體之間的語義距離,D2為候選實體與待指代消解語句之間的距離。
進一步,根據如下方法計算類型匹配度α:
其中,PL為指代詞的指代類型的預測概率,Pm為候選實體內第m個字的字標簽屬性概率,k為候選實體中字的個數。
進一步,根據如下方法計算實體與語句話題關聯度系數w1:
w1=Pt;其中,Pt為當前語句的話題的前一個話題轉移到當前語句的話題的概率。
進一步,所述實體替換后的句子概率系數w2計算方法為:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于重慶工商大學,未經重慶工商大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011042444.3/2.html,轉載請聲明來源鉆瓜專利網。





