[發明專利]指代詞恢復方法、裝置、對話機器人及存儲介質有效
| 申請號: | 202011083035.8 | 申請日: | 2020-10-12 |
| 公開(公告)號: | CN112231451B | 公開(公告)日: | 2023-09-29 |
| 發明(設計)人: | 方春華 | 申請(專利權)人: | 中國平安人壽保險股份有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F40/216;G06F40/289;G06F40/30 |
| 代理公司: | 北京市京大律師事務所 11321 | 代理人: | 姚維 |
| 地址: | 518033 廣東省深圳市福田區益田路5033號*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 指代 恢復 方法 裝置 對話 機器人 存儲 介質 | ||
本發明涉及人工智能技術領域,公開了一種指代詞恢復方法、裝置、對話機器人及存儲介質。該方法通過對多輪對話的上下文進行分割和關鍵詞的提取,并替換下文中的指代詞,利用語言模型計算替換指代詞后的句子的出現概率,基于該出現概率,選擇概率最大的一個句子作為最終的目標句子替換下文對應的句子,其中計算句子的出現概率是通過句子中的詞語和相鄰詞語之間的出現概率進行計算,這樣方法對對話中的指代詞進恢復,無需依賴與訓練集,計算速度也快,可以快速聚焦到重點詞語替換,大大提高了識別的效率,并且基于當前對話的上文關鍵詞來計算替換下文指代詞,其解析更加精準。此外,本發明還涉及區塊鏈技術,上下文本和文本序列可存儲于區塊鏈中。
技術領域
本申請涉及人工智能技術領域,具體涉及一種指代詞恢復方法、裝置、對話機器人及存儲介質。
背景技術
隨著人工智能技術的普及,尤其是對話機器人在各種場景的使用,能夠實現機器人與用戶的只有對話使得尤為重要了,而實際的人機對話中,常常會使用到指代詞,指代詞對于我們用戶來說結合前后的對話很容易就理解到對應的含義,但是對于機器人來說,其只能實現簡單明了的,且非常直白話語才能被識別,對此,在機器人對話過程中,若能實現對代詞的恢復有助于機器人改善對話質量,提高用戶的良好體驗。
目前,對于實現指代詞的恢復,提出了基于檢索的方法和基于生成的方法,而這些方法主要是通過考慮最后一句話進行推測分析和結合編解碼器模型來實現候選項的生成,并從中選擇合適的進行替換,這種方式雖然可以實現對指代詞的恢復,但是編解碼器模型的結構太過于復雜,其訓練太過于依賴指代詞的語料,并且使用時識別速度慢,精度也比較低。
發明內容
本發明的主要目的是解決現有的對話機器人在多輪對話中,識別話術的指代詞效率較低的技術問題。
本發明第一方面提供了一種指代詞恢復方法,應用于對話機器人,所述指代詞恢復方法包括:
獲取所述對話機器人中當前待處理的多輪對話,并確定所述多輪對話中的指代詞;
基于所述指代詞,將所述多輪對話劃分為上文話術和下文話術,其中所述下文話術為包含所述指代詞的句子;
利用關鍵詞提取算法,提取所述上文話術的關鍵詞集合;
調用漢語分詞工具對所述下文話術的所有句子進行分詞,并對分詞進行過濾處理,得到下文文本序列;
將所述關鍵詞集合中的關鍵詞依次替換所述下文話術中的指代詞,并通過預置的語言模型,計算替換后的句子的出現概率;
將替換后的句子的出現概率進行相互比較,選擇其中所述出現概率最大的一個句子作為目標句子,并替換與其對應的指代詞的句子,得到目標下文話術。
可選地,在本發明第一方面的第一種實現方式中,所述利用關鍵詞提取算法,提取所述上文話術的關鍵詞集合包括:
利用漢語分詞工具對所述上文話術進行分詞,并通過預設的停詞表對分詞后的上文話術句子進行過濾,得到上文文本序列;
調用互點信息算法,計算所述上文文本序列中各分詞的詞頻,并基于所述詞頻確定每個分詞的概率;
根據所述概率提取出所述上文話術的至少一個關鍵詞,形成關鍵詞集合。
可選地,在本發明第一方面的第二種實現方式中,所述調用互點信息算法,計算所述上文文本序列中各分詞的詞頻,并基于所述詞頻確定每個分詞的概率包括:
篩選出所述上文文本序列中的提問分詞,并基于所述提問分詞從語料庫中匹配出對應的答案關鍵詞;
計算所述提問分詞和答案關鍵詞在所述語料庫中出現的概率;
基于所述提問分詞的概率和所述答案關鍵詞的概率,計算出所述上文文本序列中分詞的概率。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國平安人壽保險股份有限公司,未經中國平安人壽保險股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011083035.8/2.html,轉載請聲明來源鉆瓜專利網。





