[發明專利]多輪對話文本生成方法、裝置、設備及存儲介質在審
| 申請號: | 202011432574.8 | 申請日: | 2020-12-10 |
| 公開(公告)號: | CN112527986A | 公開(公告)日: | 2021-03-19 |
| 發明(設計)人: | 回艷菲;王健宗;吳天博 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F40/284;G06N3/04;G06F17/18 |
| 代理公司: | 北京市京大律師事務所 11321 | 代理人: | 姚維 |
| 地址: | 518033 廣東省深圳市福田區福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 輪對 文本 生成 方法 裝置 設備 存儲 介質 | ||
本發明涉及人工智能領域,公開了一種多輪對話文本生成方法、裝置、設備及存儲介質。該方法包括:獲取歷史多輪對話文本和當前對話文本并分別進行詞向量轉換,得到第一詞向量和第二詞向量;將第一詞向量輸入預置HRED模型進行處理,得到相關度,將第一詞向量輸入BTM模型進行處理并采用Attention算法對提取的歷史話題進行權重賦值,得到歷史話題分布權重并和相關度進行歸一化,得到歷史多輪對話信息;將第二詞向量輸入BTM模型對提取到的話題進行捕捉,得到當前語境下的話題分布信息;拼接話題分布信息和歷史多輪對話信息并輸入對話文本生成器,以生成與當前對話文本構成的新一輪對話文本。本發明將歷史話題的上下文關系引入下一輪對話生成,生成的文本更準確。
技術領域
本發明涉及人工智能領域,尤其涉及一種多輪對話文本生成方法、裝置、設備及存儲介質。
背景技術
隨著人工智能技術的發展,利用機器人與用戶在對話中直接完成業務流程處理,可以大大減少人工成本,提高問題處理的效率。例如客服聊天的對話系統,從過去的對話均由人工問答完成,到如今先由智能客服解答常見問題再由人工解決復雜問題。人機對話中關鍵的核心技術是多輪對話生成,這是人工智能發展水平的標志,也是目前自然語言處理領域的研究熱點,受到越來越多科研人員的關注。
多輪對話生成文本時需要根據前面多個對話來進行后文生成,但是當前面多個對話中的話題發生遷移時,生成的文本往往會因為不能靈活的應對話題的變化,而導致錯誤的產生。
發明內容
本發明的主要目的在于解決現有多輪對話生成文本在面對話題遷移時生成的文本效果不佳的問題。
本發明第一方面提供了一種多輪對話文本生成方法,所述多輪對話文本生成包括:
獲取歷史多輪對話文本并進行詞向量轉換,得到第一詞向量,以及獲取當前對話文本并進行詞向量轉換,得到第二詞向量;
將所述第一詞向量輸入預置HRED模型進行信息提取,得到各歷史對話語句之間相關度,以及將所述第一詞向量輸入預置BTM模型進行話題提取,并采用預置Attention算法對提取的歷史話題進行權重賦值,得到歷史話題分布權重;
調用預置歸一化函數,對所述各歷史對話語句之間相關度和所述歷史話題分布權重進行歸一化運算,得到歷史多輪對話信息;
將所述第二詞向量輸入所述BTM模型進行當前對話語境下的話題提取,并調用預置捕捉函數對提取到的當前話題進行信息捕捉,得到當前語境下的話題分布信息;
拼接當前語境下的話題分布信息和所述歷史多輪對話信息,得到多輪對話融合信息,并將所述多輪對話融合信息輸入預置對話文本生成器進行解碼,生成與當前對話文本構成的新一輪對話文本。
可選的,在本發明第一方面的第一種實現方式中,所述HRED模型包括Word RNN網絡和Sentence RNN網絡,所述將所述第一詞向量輸入預置HRED模型進行信息提取,得到各歷史對話語句之間相關度包括:
將所述第一詞向量輸入所述Word RNN網絡,通過所述Word RNN網絡對所述第一詞向量進行語句信息提取,得到各歷史對話語句信息;
將所述各歷史對話語句信息輸入所述Sentence RNN網絡,通過所述Sentence RNN網絡對所述各歷史對話語句信息進行相關度計算,得到各歷史對話語句之間相關度。
可選的,在本發明第一方面的第二種實現方式中,所述將所述第一詞向量輸入預置BTM模型進行話題提取,得到多個歷史話題包括:
將所述第一詞向量輸入預置BTM模型,通過所述BTM模型對所述第一詞向量進行topic-Biterm概率分布計算,得到第一話題分布信息,其中,所述第一話題分布信息包括多個歷史話題。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011432574.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種電氣配電柜
- 下一篇:多音字發音的預測方法、裝置、設備及存儲介質





