[發明專利]一種對話模型的訓練方法及裝置、對話響應方法及裝置有效

申請號：	202211441290.4	申請日：	2022-11-17
公開（公告）號：	CN115495568B	公開（公告）日：	2023-08-22
發明（設計）人：	劉紅麗;李峰	申請（專利權）人：	蘇州浪潮智能科技有限公司
主分類號：	G06F16/332	分類號：	G06F16/332;G06F40/289;G06F40/58;G06F18/214
代理公司：	北京集佳知識產權代理有限公司 11227	代理人：	王華
地址：	215100 江蘇省蘇州***	國省代碼：	江蘇;32
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	一種對話模型訓練方法裝置響應
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

本發明公開了一種對話模型的訓練方法，包括：利用通用對話數據集對原始對話模型進行訓練，得到通用對話模型；獲取預設的專業關鍵詞組，根據專業關鍵詞組對通用對話數據集進行數據篩選；利用篩選到的初始標注數據集對通用對話模型進行訓練，得到初始專業對話模型；利用驗證數據集和預設自然語言處理評價指標對初始專業對話模型進行驗證，得到驗證得分；判斷驗證得分是否大于預設得分閾值；若是，則將初始專業對話模型確定為目標專業對話模型。本發明使得訓練出來的目標專業對話模型同時擁有通用性和專業性，提升了用戶使用體驗。本發明還公開了一種對話模型的訓練裝置、對話響應方法及裝置、電子設備及計算機可讀存儲介質，具有相應技術效果。

技術領域

本發明涉及人工智能技術領域，特別是涉及一種對話模型的訓練方法及裝置、對話響應方法及裝置、電子設備及計算機可讀存儲介質。

背景技術

人機對話作為自然語言處理（Natural?Language?Processing，NLP）的一項基礎應用，一直備受學術界和工業界的重視。隨著人工智能技術的發展，基于生成式的對話模型越來越受歡迎，它們專門針對對話數據進行訓練，在開放域對話獲得了非常好的表現。但是從頭開始訓練對話大模型，需要大量的多類型對話數據作為訓練語料，這需要的成本比較高，訓練耗時長。

在專業的人機對話系統中常常也會存在不同的聊天需求，包括：閑聊、常識問答以及專業問答等。如醫療機器人在與病人聊天過程中不僅要回答醫療專業知識，生活中常識問題也會涉及到，還要會閑聊排解病人的情緒。目前專業的對話模型大部分采用檢索方式，其主要原理是語義匹配，即在知識庫中找到用戶提問的問題的答案。雖然技術已比較成熟，但太依賴于語料，知識片面、回復單一生硬，缺乏通用性和多樣性，用戶體驗感差。

綜上所述，如何有效地解決現有的對話響應方法回復單一生硬，缺乏通用性和多樣性，用戶體驗感差等問題，是目前本領域技術人員急需解決的問題。

發明內容

本發明的目的是提供一種對話模型的訓練方法，該方法使得訓練出來的目標專業對話模型同時擁有通用性和專業性，提升了用戶使用體驗；本發明的另一目的是提供一種對話模型的訓練裝置、對話響應方法及裝置、電子設備及計算機可讀存儲介質。

為解決上述技術問題，本發明提供如下技術方案：

一種對話模型的訓練方法，包括：

利用預獲取的通用對話數據集對原始對話模型進行訓練，得到通用對話模型；

獲取預設的專業關鍵詞組，并根據所述專業關鍵詞組對所述通用對話數據集進行數據篩選，將篩選得到的數據集確定為初始標注數據集；

利用所述初始標注數據集對所述通用對話模型進行訓練，得到初始專業對話模型；

利用驗證數據集和預設自然語言處理評價指標對所述初始專業對話模型進行驗證操作，得到驗證得分；

判斷所述驗證得分是否大于預設得分閾值；

若是，則將所述初始專業對話模型確定為目標專業對話模型。

在本發明的一種具體實施方式中，當確定所述驗證得分小于等于所述預設得分閾值時，還包括：