[發明專利]對話內容挖掘方法和對話內容評估模型的生成方法有效
| 申請號: | 202210591004.6 | 申請日: | 2022-05-27 |
| 公開(公告)號: | CN114969195B | 公開(公告)日: | 2023-10-27 |
| 發明(設計)人: | 劉坤;劉凱 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06F16/26 | 分類號: | G06F16/26;G06F16/332;G06F40/35;G06F18/23;G06N3/04;G06N3/08 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙) 11201 | 代理人: | 羅嵐 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 對話 內容 挖掘 方法 評估 模型 生成 | ||
本公開提供了對話內容挖掘方法和對話內容評估模型的生成方法,涉及人工智能技術領域,尤其涉及深度學習、數據處理、自然語言處理等領域。具體實現方案為:獲取包括平臺對話內容的待挖掘對話對應的用戶畫像和產品畫像,將待挖掘對話切分為多個類型的語義單元,根據同一類型的語義單元中的平臺對話內容的意圖、用戶畫像和產品畫像對平臺對話內容進行聚類以生成聚類平臺對話內容,并和對話內容評估模型確定目標對話內容。本公開通過對平臺對話內容進行聚類以生成聚類平臺對話內容并和對話內容評估模型確定目標對話內容,減少了時間和人力成本,提高了對話內容挖掘結果的準確度,增強了對實際應用場景的適應性,從而提高了工作效率。
技術領域
本公開涉及人工智能技術領域中的深度學習、數據處理、自然語言處理等領域,尤其涉及一種對話內容挖掘方法和對話內容評估模型的生成方法。
背景技術
目前,在對話內容挖掘場景中,通過將優秀專員的溝通錄音通過針對產品行業溝通場景專門優化的ASR(Automatic Speech Recognition,自動語音識別技術)服務轉寫為文本,并且分離出錄音中的專員講話部分和客戶講話部分,借助專門的聚類算法,找出相似語義的句子,最后結合業務經驗,總結出優秀專員的最佳實踐對話內容。
但是,對話內容挖掘的過程花費的時間和人力成本較高,對話內容挖掘結果的準確度一般,對實際應用場景的適用性不高,從而導致工作效率較低。
發明內容
本公開提供了一種對話內容挖掘和對話內容評估模型的生成方法、裝置、電子設備及存儲介質。
根據第一方面,提供了一種對話內容挖掘方法,包括:獲取待挖掘對話,所述待挖掘對話中包括平臺對話內容;獲取所述待挖掘對話對應的用戶畫像和產品畫像;將所述待挖掘對話切分為多個類型的語義單元;根據同一類型的所述語義單元中的平臺對話內容的意圖、所述用戶畫像和產品畫像對所述平臺對話內容進行聚類,以生成聚類平臺對話內容;以及根據所述聚類平臺對話內容和對話內容評估模型確定所述聚類平臺對話內容中的目標對話內容。
根據第二方面,提供了一種對話內容評估模型的生成方法,包括:獲取樣本對話,所述樣本對話中包括平臺對話內容;獲取所述樣本對話對應的用戶畫像和產品畫像;將所述樣本對話切分為多個類型的語義單元;根據同一類型的所述語義單元中的平臺對話內容的意圖、所述用戶畫像和產品畫像對所述平臺對話內容進行聚類,以生成聚類平臺對話內容;以及根據所述聚類平臺對話內容和所述聚類平臺對話內容的實際對話內容評估結果對待訓練的對話內容評估模型進行訓練,以生成對話內容評估模型。
根據第三方面,提供了一種對話內容挖掘裝置,包括:第一獲取模塊,用于獲取待挖掘對話,所述待挖掘對話中包括平臺對話內容;第二獲取模塊,用于獲取所述待挖掘對話對應的用戶畫像和產品畫像;第一切分模塊,用于將所述待挖掘對話切分為多個類型的語義單元;第一聚類模塊,用于根據同一類型的所述語義單元中的平臺對話內容的意圖、所述用戶畫像和產品畫像對所述平臺對話內容進行聚類,以生成聚類平臺對話內容;以及確定模塊,用于根據所述聚類平臺對話內容和對話內容評估模型確定所述聚類平臺對話內容中的目標對話內容。
根據第四方面,提供了一種對話內容評估模型的生成裝置,包括:第三獲取模塊,用于獲取樣本對話,所述樣本對話中包括平臺對話內容;第四獲取模塊,用于獲取所述樣本對話對應的用戶畫像和產品畫像;第二切分模塊,用于將所述樣本對話切分為多個類型的語義單元;第二聚類模塊,用于根據同一類型的所述語義單元中的平臺對話內容的意圖、所述用戶畫像和產品畫像對所述平臺對話內容進行聚類,以生成聚類平臺對話內容;以及訓練模塊,用于根據所述聚類平臺對話內容和所述聚類平臺對話內容的實際對話內容評估結果對待訓練的對話內容評估模型進行訓練,以生成對話內容評估模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210591004.6/2.html,轉載請聲明來源鉆瓜專利網。
- 內容再現系統、內容提供方法、內容再現裝置、內容提供裝置、內容再現程序和內容提供程序
- 內容記錄系統、內容記錄方法、內容記錄設備和內容接收設備
- 內容服務系統、內容服務器、內容終端及內容服務方法
- 內容分發系統、內容分發裝置、內容再生終端及內容分發方法
- 內容發布、內容獲取的方法、內容發布裝置及內容傳播系統
- 內容提供裝置、內容提供方法、內容再現裝置、內容再現方法
- 內容傳輸設備、內容傳輸方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容發送設備、內容發送方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容再現裝置、內容再現方法、內容再現程序及內容提供系統
- 內容記錄裝置、內容編輯裝置、內容再生裝置、內容記錄方法、內容編輯方法、以及內容再生方法





