[發明專利]一種基于用戶對話歷史的個性化對話生成方法和系統在審
| 申請號: | 202011060186.1 | 申請日: | 2020-09-30 |
| 公開(公告)號: | CN112182161A | 公開(公告)日: | 2021-01-05 |
| 發明(設計)人: | 竇志成;文繼榮 | 申請(專利權)人: | 中國人民大學 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/332;G06F40/30;G06K9/62 |
| 代理公司: | 北京紀凱知識產權代理有限公司 11245 | 代理人: | 趙悅 |
| 地址: | 100872 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 用戶 對話 歷史 個性化 生成 方法 系統 | ||
1.一種基于用戶對話歷史的個性化對話生成方法,其特征在于,包括以下步驟:
S1將用戶對話歷史的文本表示為句子向量;
S2通過對所述句子向量進行編碼得到用戶個性向量,所述用戶個性向量中包含了所述句子向量的時序信息;
S3根據所述用戶個性向量和所述句子向量的時序信息生成個性化對話模型;
S4將新的輸入文本的詞向量輸入所述個性化對話模型生成個性化對話的回復。
2.如權利要求1所述的基于用戶對話歷史的個性化對話生成方法,其特征在于,所述步驟S4中輸入的詞向量進入編碼器進行編碼,并將經過編碼的所述輸入的詞向量帶入注意力機制,經過注意力機制后,進入所述個性化對話模型進行解碼。
3.如權利要求2所述的基于用戶對話歷史的個性化對話生成方法,其特征在于,所述個性化對話模型的解碼公式為:
st=GRUdecoder(st-1,[φ(yt-1),ct,Vu])
其中,GRU是門控循環單元,st是解碼器在解碼過程中每個時刻t的隱含狀態;φ(·)表示獲取詞向量的函數;yt是在時刻t生成詞的詞向量ci是通過注意力機制權重對編碼器所有中間狀態加權求和得到的上下文信息的向量;Vu是用戶u的個性向量。
4.如權利要求3所述的基于用戶對話歷史的個性化對話生成方法,其特征在于,獲取所述步驟S2中的個性向量的方法為:首先通過計算用戶對話歷史中單詞的逆文檔頻率對單詞詞向量付以不同權重,隨后通過GRU提取用戶對話歷史中的時序信息,并使用最后一個時刻得到的隱含狀態,作為用戶全局的個性化角色信息。
5.如權利要求4所述的基于用戶對話歷史的個性化對話生成方法,其特征在于,所述單詞的逆文檔頻率idf的計算公式為:
其中,a、b、c分別表示詞表中單詞的序號,文檔集合中文檔的序號和句子w中單詞的序號;D={d1,d2,…}為整個文檔集合;{b:wa∈db}為包含單詞wa的文檔db的集合;∈(·)表示計算句子w的句子向量的函數;φ(·)表示獲取單詞詞向量的函數。
6.如權利要求4所述的基于用戶對話歷史的個性化對話生成方法,其特征在于,所述用戶全局的個性化角色信息的計算公式為:
其中,R={r1,r2,..,rL}表示用戶的回復歷史,rl為用戶對話回復歷史第l條回復文本,L為用戶回復歷史長度;為在用戶第l條回復后其角色向量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國人民大學,未經中國人民大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011060186.1/1.html,轉載請聲明來源鉆瓜專利網。





