[發明專利]人機對話模型訓練方法、人機對話方法及系統有效
| 申請號: | 202010195133.4 | 申請日: | 2020-03-19 |
| 公開(公告)號: | CN111324736B | 公開(公告)日: | 2022-07-08 |
| 發明(設計)人: | 朱欽佩 | 申請(專利權)人: | 思必馳科技股份有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F16/332 |
| 代理公司: | 北京商專永信知識產權代理事務所(普通合伙) 11400 | 代理人: | 黃謙;車江華 |
| 地址: | 215123 江蘇省蘇州市蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 人機對話 模型 訓練 方法 系統 | ||
本發明公開一種人機對話模型訓練方法,所述人機對話模型包括編碼器和解碼器,所述方法包括:預先構建訓練樣本集,所述訓練樣本集至少基于有效問題?答案對子集和無效問題?答案對子集構成;采用所述訓練樣本集對所述編碼器進行預訓練得到初始編碼器;采用所述訓練樣本集對所述初始編碼器和所述解碼器進行聯合訓練。本發明通過將無效問題融入到訓練樣本集中,并且基于該訓練樣本集對編碼器進行預訓練,使得訓練得到的初始編碼器學習到了需要進行特殊回復無效問題的特征,進一步基于訓練樣本集對初始編碼器和解碼器進行聯合訓練,從而得到了能夠針對需要進行特殊回復的無效問句生成合適答復內容的人機對話模型。
技術領域
本發明涉及人機對話技術領域,尤其涉及一種人機對話模型訓練方法、人機對話方法及系統。
背景技術
當前,人機對話技術已經開始廣泛地應用到人們的生活中,比如車載語音,外呼系統,智能音箱等等。但是,現在的人機閑聊技術還達不到像人一樣“對答如流”,問答系統如何精細的處理“沒有準備的問題”是影響用戶體驗的最大難題之一。例如,語音對話中同音詞導致的問題“功課的公式哪個宮”,噪音導致的問題“八八八八八八一”,被要求做力所不及的事情“給我打開窗簾”等等。
基于匹配技術的問答系統面對上述問題,一般采用簡單粗暴的方式,即匹配不到對應的問題,一律采用盲區回復,例如“這個問題我不知道”。基于匹配的問答系統最大的優勢是準確性高,能很好的回復“準備好”的問題,缺點是覆蓋面小,總是回復“我不知道”會影響用戶的直接體驗。
還有一種問答系統是基于生成式神經網絡的問答系統,通過訓練好的神經網絡模型和用戶輸入,“計算”出回復內容,輸出給用戶。這種方式的好處是覆蓋面廣,付出較低的成本,就可以回復用戶的各種問題。缺點是某些問題回復不準確,尤其是在語義上難以理解的問題,系統回復往往“斷章取義”,影響用戶體驗,例如下表1所示:
表1
用戶輸入 系統回復 功課的公式哪個宮 小主人,要好好做功課啊 八八八八八八一 八一建軍節 給我打開窗簾 小主人不要打我啊
發明內容
本發明實施例提供一種人機對話模型訓練方法、人機對話方法及系統,用于至少解決上述技術問題之一。
第一方面,本發明實施例提供一種人機對話模型訓練方法,所述人機對話模型包括編碼器和解碼器,所述方法包括:
預先構建訓練樣本集,所述訓練樣本集至少基于有效問題-答案對子集和無效問題-答案對子集構成;
采用所述訓練樣本集對所述編碼器進行預訓練得到初始編碼器;
采用所述訓練樣本集對所述初始編碼器和所述解碼器進行聯合訓練。
第二方面,本發明實施例還提供一種人機對話方法,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于思必馳科技股份有限公司,未經思必馳科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010195133.4/2.html,轉載請聲明來源鉆瓜專利網。





