[發明專利]用于保持對話系統對話連貫性的方法及系統有效

申請號：	201611060135.2	申請日：	2016-11-24
公開（公告）號：	CN106776828B	公開（公告）日：	2020-12-15
發明（設計）人：	簡仁賢;王海波	申請（專利權）人：	竹間智能科技（上海）有限公司
主分類號：	G06F16/332	分類號：	G06F16/332;G06F40/289;G06F40/30
代理公司：	北京酷愛智慧知識產權代理有限公司 11514	代理人：	趙永輝
地址：	200233 上海市浦東新區自由貿***	國省代碼：	上海;31
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	用于保持對話系統連貫性方法
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【權利要求書】：

1.一種用于保持對話系統對話連貫性的方法，其特征在于，包括：

步驟S1：根據當前對話輸入，實時地從所有歷史對話中切割出與當前對話屬于同一話題的相關話題集合；

步驟S2：從所述相關話題集合中挖掘出當前話題關鍵詞；

步驟S3：根據所述當前對話輸入和所述當前話題關鍵詞，確定應答輸出；

所述根據當前對話輸入，實時地從所有歷史對話中切割出與當前對話屬于同一話題的相關話題集合，具體包括：

步驟S1.1：將當前對話輸入標記為Q0，并對所述歷史對話重新標記，其中，歷史對話為[Q1,A1]，[Q2,A2]，…[Qi,Ai]，…[Qn,An]，重新標記后的歷史對話為S1，S2，S3，S4，…,S_2i-1,S_2i,…S_2n-1,S_2n，其中，n為歷史對話的總數量，[Qi,Ai]為第i輪歷史對話，Qi為第i輪歷史對話中的對話輸入，Ai為第i輪歷史對話中的應答輸出，S_2i-1為Qi重新標記后對應的句子，S_2i為Ai重新標記后對應的句子；

步驟S1.2：根據當前對話輸入和所述重新標記后的歷史對話，按照預先設定的話題切割規則進行話題切割，以獲得所有歷史對話中與當前對話輸入屬于同一話題的相關話題集合；

所述話題切割規則為：

a)計算S1與Q0的之間語義相似度M_1，0，若M_1，0＜T，則S1與Q0不屬于同一話題，若M_1，0≥T，則繼續計算b)，其中，T為預先設置的話題分割閾值；

b)計算S2分別與S1和QO之間的語義相似度M_2,1,M_2,0，若max(M_2,1,M_2,0)＜T，則S1與Q0屬于同一話題，若max(M_2,1,M_2,0)≥T，則繼續計算c)；

c)計算S3分別與S2，S1和QO之間的語義相似度M_3,2，M_3,1，M_3,0，若max(M_3,2,M_3,1,M_3,0)＜T，則S2，S1與Q0屬于同一話題，若max(M_3,2,M_3,1,M_3,0)≥T，則繼續計算下一步驟；

以此類推，以獲得所有歷史對話中與當前對話輸入屬于同一話題的相關話題集合。

2.根據權利要求1所述的用于保持對話系統對話連貫性的方法，其特征在于，計算每兩個句子之間語義相似度的步驟包括，

將所述兩個句子分別轉換成句子向量，以獲得第一句子向量和第二句子向量；

計算所述第一句子向量與所述第二句子向量之間的余弦值，并將此余弦值記為兩個句子間的語義相似度。

3.根據權利要求2所述的用于保持對話系統對話連貫性的方法，其特征在于，所述將句子轉換成句子向量的步驟具體包括，

對所述句子進行分詞，以獲得至少一個詞；

在預先訓練好的word2vec矩陣中匹配出每個詞對應的詞向量；