[發明專利]用于保持對話系統對話連貫性的方法及系統有效
| 申請號: | 201611060135.2 | 申請日: | 2016-11-24 |
| 公開(公告)號: | CN106776828B | 公開(公告)日: | 2020-12-15 |
| 發明(設計)人: | 簡仁賢;王海波 | 申請(專利權)人: | 竹間智能科技(上海)有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F40/289;G06F40/30 |
| 代理公司: | 北京酷愛智慧知識產權代理有限公司 11514 | 代理人: | 趙永輝 |
| 地址: | 200233 上海市浦東新區自由貿*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 保持 對話 系統 連貫性 方法 | ||
1.一種用于保持對話系統對話連貫性的方法,其特征在于,包括:
步驟S1:根據當前對話輸入,實時地從所有歷史對話中切割出與當前對話屬于同一話題的相關話題集合;
步驟S2:從所述相關話題集合中挖掘出當前話題關鍵詞;
步驟S3:根據所述當前對話輸入和所述當前話題關鍵詞,確定應答輸出;
所述根據當前對話輸入,實時地從所有歷史對話中切割出與當前對話屬于同一話題的相關話題集合,具體包括:
步驟S1.1:將當前對話輸入標記為Q0,并對所述歷史對話重新標記,其中,歷史對話為[Q1,A1],[Q2,A2],…[Qi,Ai],…[Qn,An],重新標記后的歷史對話為S1,S2,S3,S4,…,S2i-1,S2i,…S2n-1,S2n,其中,n為歷史對話的總數量,[Qi,Ai]為第i輪歷史對話,Qi為第i輪歷史對話中的對話輸入,Ai為第i輪歷史對話中的應答輸出,S2i-1為Qi重新標記后對應的句子,S2i為Ai重新標記后對應的句子;
步驟S1.2:根據當前對話輸入和所述重新標記后的歷史對話,按照預先設定的話題切割規則進行話題切割,以獲得所有歷史對話中與當前對話輸入屬于同一話題的相關話題集合;
所述話題切割規則為:
a)計算S1與Q0的之間語義相似度M1,0,若M1,0<T,則S1與Q0不屬于同一話題,若M1,0≥T,則繼續計算b),其中,T為預先設置的話題分割閾值;
b)計算S2分別與S1和QO之間的語義相似度M2,1,M2,0,若max(M2,1,M2,0)<T,則S1與Q0屬于同一話題,若max(M2,1,M2,0)≥T,則繼續計算c);
c)計算S3分別與S2,S1和QO之間的語義相似度M3,2,M3,1,M3,0,若max(M3,2,M3,1,M3,0)<T,則S2,S1與Q0屬于同一話題,若max(M3,2,M3,1,M3,0)≥T,則繼續計算下一步驟;
以此類推,以獲得所有歷史對話中與當前對話輸入屬于同一話題的相關話題集合。
2.根據權利要求1所述的用于保持對話系統對話連貫性的方法,其特征在于,計算每兩個句子之間語義相似度的步驟包括,
將所述兩個句子分別轉換成句子向量,以獲得第一句子向量和第二句子向量;
計算所述第一句子向量與所述第二句子向量之間的余弦值,并將此余弦值記為兩個句子間的語義相似度。
3.根據權利要求2所述的用于保持對話系統對話連貫性的方法,其特征在于,所述將句子轉換成句子向量的步驟具體包括,
對所述句子進行分詞,以獲得至少一個詞;
在預先訓練好的word2vec矩陣中匹配出每個詞對應的詞向量;
對匹配出的所有所述詞向量進行計算,以獲得所述句子對應的句子向量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于竹間智能科技(上海)有限公司,未經竹間智能科技(上海)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611060135.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:用于自動化擴展層次化本體知識庫的方法
- 下一篇:一種數據導出系統及其工作方法





