[發明專利]信息交互平臺的交互數據分類方法、裝置及存儲介質在審
| 申請號: | 202010061143.9 | 申請日: | 2020-01-19 |
| 公開(公告)號: | CN111259649A | 公開(公告)日: | 2020-06-09 |
| 發明(設計)人: | 曾冰清 | 申請(專利權)人: | 深圳壹賬通智能科技有限公司 |
| 主分類號: | G06F40/211 | 分類號: | G06F40/211;G06F40/289;G06F40/30;G06K9/62 |
| 代理公司: | 北京鴻元知識產權代理有限公司 11327 | 代理人: | 袁文婷;王迎 |
| 地址: | 518000 廣東省深圳市前海深港合作區前*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 信息 交互 平臺 數據 分類 方法 裝置 存儲 介質 | ||
本發明屬于互聯網交互信息處理技術領域,本發明提供一種信息交互平臺的交互數據分類方法、裝置及計算機可讀存儲介質,其中的方法包括:對從交互數據語料庫中獲取的交互數據做語句編號處理,得到編號語句;剔除編號語句中沒有語義價值的詞語,得到精選編號語句;計算出組成精選編號語句中的詞語在交互數據語料庫中出現的詞頻;確定組成精選編號語句的詞語在交互數據語料庫中的權重;將組成精選編號語句的詞語在交互數據語料庫中的權重整理為編號特征向量;根據編號特征向量計算每兩個編號語句的相似值;根據相似值對編號語句進行歸類。本發明通過客服與用戶的聊天記錄直接總結出用戶的痛點問題,節約時間、節省人力、提高工作效率。
技術領域
本發明屬于互聯網交互信息處理技術領域,尤其涉及一種信息交互平臺的交互數據分類方法、裝置及計算機可讀存儲介質。
背景技術
用戶的痛點問題指用戶最迫切的訴求,每個平臺都會關注用戶的痛點問題有哪些。然后針對用戶的痛點問題給用戶提供解決方法,為用戶提供更好的服務,從而吸引和穩定用戶的數量。傳統發現用戶痛點問題的方法是通過走訪用戶或者讓用戶反饋問題和評價服務從而得出用戶的訴求,這種直接面對用戶的行為在一定程度上讓用戶付出了時間成本,用戶體驗也不好。
目前,解決上述問題的方法為:收集與用戶的聊天記錄,然后通過大量的人工對用戶的聊天記錄進行分析整理,工作量大,需要耗費大量的人力,而且工作效率低,浪費時間。
發明內容
基于上述現有技術中存在的問題,本發明提供一種信息交互平臺的交互數據分類方法、裝置及計算機可讀存儲介質,其主要目的在于,通過從客服人員與用戶的交互數據語料庫中獲取交互數據,對獲取的交互數據進行一系列處理,最終得到用戶的痛點問題分類,本發明通過客服人員與用戶的聊天記錄,直接總結出用戶的痛點問題,節約時間、節省人力、提高工作效率。
為實現上述目的,本發明提供一種信息交互平臺的交互數據分類方法,該方法包括:
對從交互數據語料庫中獲取的交互數據做語句編號處理,得到編號語句;
根據預設的沒有語義價值的詞語集合,剔除所述編號語句中沒有語義價值的詞語,得到精選編號語句;
利用預設的權重算法,計算出組成所述精選編號語句中的詞語在所述交互數據語料庫中出現的詞頻;
根據所述詞頻,確定組成所述精選編號語句的詞語在所述交互數據語料庫中的權重;
將組成所述精選編號語句的詞語在所述交互數據語料庫中的權重整理為編號特征向量;
根據所述編號特征向量計算每兩個編號語句的相似值;
根據所述相似值對所述編號語句進行歸類。
優選地,所述對從交互數據語料庫中獲取的交互數據做語句編號處理的步驟包括:
將從所述交互數據語料庫中獲取的交互數據語句按時間順序進行排序,得到時間排序語句;
確定出所述時間排序語句中的語料最小單元,其中,所述語料最小單元為用戶每次所發送的對話語句;
對所述語料最小單元進行編號。
優選地,所述根據預設的沒有語義價值的詞語集合,剔除所述編號語句中沒有語義價值的詞語的步驟包括:
將所述編號語句的語料最小單元進行分詞處理,得到分詞集合;
將所述分詞集合與預設的沒有語義價值的詞語集合做差集處理,除去沒有語義價值的詞語。
優選地,所述預設的權重算法為TF-IDF算法,所述TF-IDF算法的公式為:
TF-IDF=TF*log(N/Nw),
TF=Tn/Dn;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳壹賬通智能科技有限公司,未經深圳壹賬通智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010061143.9/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:用于使用監督式高品質成像的圖像采集的系統和方法
- 下一篇:顯示裝置及家電設備
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





