[發明專利]一種基于特征融合的電銷用戶意圖識別方法和系統在審
| 申請號: | 202011229635.0 | 申請日: | 2020-11-06 |
| 公開(公告)號: | CN112102013A | 公開(公告)日: | 2020-12-18 |
| 發明(設計)人: | 彭馨;王強 | 申請(專利權)人: | 北京讀我科技有限公司 |
| 主分類號: | G06Q30/02 | 分類號: | G06Q30/02;G06N20/00;G06N3/08 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 錢娜 |
| 地址: | 100088 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 特征 融合 用戶 意圖 識別 方法 系統 | ||
本發明公開了一種基于特征融合的電銷用戶意圖識別方法和系統,方法包括:獲取目標用戶的當前通話文本和目標用戶的標簽特征;獲取預先構建的特征融合模型,其中,特征融合模型至少基于目標用戶的歷史通話文本和目標用戶的標簽特征構建;將目標用戶的當前通話文本和目標用戶的標簽特征輸入特征融合模型進行識別,得到目標用戶的意圖識別結果。本發明通過至少基于目標用戶的歷史通話文本和目標用戶的標簽特征構建的特征融合模型對目標用戶的當前通話文本和目標用戶的標簽特征進行識別,相對于現有技術只通過標簽特征對電銷用戶的意圖進行識別,有效的提高電銷用戶意圖識別結果的準確性。
技術領域
本發明涉及數據處理技術領域,尤其涉及一種基于特征融合的電銷用戶意圖識別方法和系統。
背景技術
目前在電銷領域,主要是通過分析用戶的標簽特征,如:年齡、地域和性別等,來對用戶的付費意愿進行評價,從而對意愿度高的用戶做持續性的營銷。但由于標簽特征的間接性和有限性,使得基于標簽特征的意圖識別模型在對用戶的評價上有一定的局限性。
因此,如何有效的提高電銷用戶意圖識別結果的準確性,是一項亟待解決的問題。
發明內容
有鑒于此,本發明提供了一種基于特征融合的電銷用戶意圖識別方法,能夠有效的提高電銷用戶意圖識別結果的準確性。
本發明提供了一種基于特征融合的電銷用戶意圖識別方法,包括:
獲取目標用戶的當前通話文本和目標用戶的標簽特征;
獲取預先構建的特征融合模型,其中,所述特征融合模型至少基于所述目標用戶的歷史通話文本和所述目標用戶的標簽特征構建;
將所述目標用戶的當前通話文本和目標用戶的標簽特征輸入所述特征融合模型進行識別,得到所述目標用戶的意圖識別結果。
優選地,構建特征融合模型包括:
獲取目標用戶的第一歷史通話文本和目標用戶的第一標簽特征;
對所述第一歷史通話文本和第一標簽特征進行預處理,得到符合訓練要求的第二歷史通話文本和第二標簽特征;
將所述第二歷史通話文本和第二標簽特征構成的訓練數據分為第一訓練集和第二訓練集;
通過所述第一訓練集中的第二標簽特征數據對機器學習模型進行訓練,得到訓練后的機器學習模型;
通過所述第一訓練集中的第二歷史通話文本數據對神經網絡模型進行訓練,得到訓練后的神經網絡模型;
測試所述第二訓練集中的第二標簽特征數據在所述訓練后的機器學習模型的得分,以及所述第二訓練集中的第二歷史通話文本數據在所述訓練后的神經網絡模型的得分,將得分作為新的訓練數據;
基于所述新的訓練數據得到融合函數;
基于所述訓練后的機器學習模型、所述訓練后的神經網絡模型和所述融合函數構成特征融合模型。
優選地,所述通過所述第一訓練集中的第二標簽特征數據對機器學習模型進行訓練,得到訓練后的機器學習模型,包括:
通過所述第一訓練集中的第二標簽特征數據采用XGBoost算法對機器學習模型進行訓練,得到訓練后的機器學習模型。
優選地,所述神經網絡模型包括:BERT模型和長短期記憶網絡。
優選地,所述基于所述新的訓練數據得到融合函數,包括:
基于所述新的訓練數據,采用機器學習算法,得到融合函數。
一種基于特征融合的電銷用戶意圖識別系統,包括:
第一獲取模塊,用于獲取目標用戶的當前通話文本和目標用戶的標簽特征;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京讀我科技有限公司,未經北京讀我科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011229635.0/2.html,轉載請聲明來源鉆瓜專利網。





