[發明專利]一種基于場景上下文的人機多輪對話模型構建方法有效
| 申請號: | 201711415719.1 | 申請日: | 2017-12-25 |
| 公開(公告)號: | CN108170764B | 公開(公告)日: | 2022-06-14 |
| 發明(設計)人: | 武星;杜智康 | 申請(專利權)人: | 上海大學 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F40/211 |
| 代理公司: | 上海上大專利事務所(普通合伙) 31205 | 代理人: | 陸聰明 |
| 地址: | 200444*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 場景 上下文 人機 輪對 模型 構建 方法 | ||
1.一種基于場景上下文的人機多輪對話模型構建方法,其特征在于,具體步驟如下:
a)定義詞語、問答句、場景三種上下文的抽象表示概念;
b)基于上述三種上下文提取的方法,將原始問答庫訓練為多個場景表示的問答場景知識庫;
c)對于輸入的問題首先獲取其上述三種上下文的抽象表示,再進行場景匹配,提取場景中的問答句上下文序列并結合當前問句上下文,組成新的問答句上下文序列以生成合理應答;
所述步驟a)具體為:在一個時間段內的對話過程中存在多個場景的切換,將對話過程劃分為多個場景,每個場景由多個問答句組成,它們包含用于描述場景的重要信息;問答句又由有序的詞語組合而成,詞與詞之間的相互關系,是對問答句內容的重要描述;人機多輪對話模型需要提取三種上下文表示:詞語上下文、問答句上下文以及場景上下文,這些上下文信息均由高維的向量表示;詞語上下文包含了詞語的基本含義以及詞與詞之間的相似度關系,含義越相似的詞語,在上下文向量空間中距離越相近;問答句上下文是詞語上下文序列的高層次表示,它隱含了問答句中各詞的含義、以及詞與詞之間的相互作用關系,在問答句上下文向量空間中,含義越相似的問答句,其上下文向量空間中的距離就越相近;場景上下文是對一個場景中的問答句上下文序列的更高層抽象表示,它隱含地表達了一個場景中所有問答句上下文的信息,不同的場景上下文內容不同,其場景上下文的表示也有所差異;
所述步驟b)具體為:原始的問答庫只是簡單的一問一答形式的文本,基于步驟a)中三種上下文獲取的方法,將整個問答庫整理為多個場景,獲取每一個問答的詞向量、句向量,以及每一個場景的場景上下文向量,使整個問答庫按場景劃分,各場景以場景上下文向量的距離區分,每個場景存在已經訓練好的問答句上下文表示,從而構建問答場景知識庫;
所述步驟c)具體為:人機對話系統中存在兩個場景庫,一個是在整個對話過程中逐步產生的對話場景庫,另一個是問答庫中固定的場景庫;對于新的輸入,首先提取其三種上下文表示,然后從對話場景庫中匹配場景,若無法匹配到最佳場景,再從問答庫中匹配場景;匹配完畢后,系統抽取出該場景下的所有的問答句上下文序列,結合當前問句上下文組成新的問答句上下文序列以生成合理應答。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海大學,未經上海大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711415719.1/1.html,轉載請聲明來源鉆瓜專利網。





