[發明專利]用戶問題獲得方法、裝置及電子設備有效
| 申請號: | 202110033442.6 | 申請日: | 2021-01-12 |
| 公開(公告)號: | CN112364149B | 公開(公告)日: | 2021-04-23 |
| 發明(設計)人: | 黃詩雅 | 申請(專利權)人: | 廣州云趣信息科技有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/33;G06F16/35;G06F40/211;G06F40/289;G06K9/62 |
| 代理公司: | 北京博雅睿泉專利代理事務所(特殊普通合伙) 11442 | 代理人: | 馬鐵良 |
| 地址: | 510665 廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用戶 問題 獲得 方法 裝置 電子設備 | ||
本申請公開了一種用戶問題獲得方法、裝置及電子設備,該方法包括:獲取原始文本對話數據;從所述原始文本對話數據中,獲取目標文本數據,其中,所述目標文本數據為與目標角色類別對應的文本數據;根據所述目標文本數據,獲得目標用戶問題,其中,所述目標用戶問題為目標用戶在所述原始文本對話數據中提問的問題,所述目標用戶的用戶角色為所述目標角色類別。該方法可以方便、準確的獲得原始文本對話數據中目標用戶提問的問題。
技術領域
本公開涉及自然語言處理技術領域,更具體地,涉及一種用戶問題獲得方法、裝置及電子設備。
背景技術
在日常生活中,用戶一般可以通過語音通話方式向企業客服咨詢產品售前、售后等問題;而語音通話過程中,通常需要企業客服快速、準確的回答用戶問題。
在實際中,為了使得企業客服可以快速、準確的回答用戶問題,通常是在獲得用戶授權使用其通話語音的情況下,由人工針對用戶歷史通話語音進行復聽、手動標注和整理,以提取出用戶經常提問的問題,并通過構建用戶問題庫和基于該用戶問題庫對企業客服進行培訓的方式,使得企業客服可以可快速、準確的回答用戶問題。
在實現本申請的過程中,發明人方發現現有的提取用戶問題的方法一方面是主要依賴于人工,存在費時費力的問題;另一方面,由于人工標注可能出錯,所以還可能導致提取結果不夠準確的問題,因此,有必要提供一種用戶問題獲得方法,以解決上述問題。
發明內容
本公開的第一方面,提供了一種用戶問題獲得方法,包括:
獲取原始文本對話數據;
從所述原始文本對話數據中,獲取目標文本數據,其中,所述目標文本數據為與目標角色類別對應的文本數據;
根據所述目標文本數據,獲得目標用戶問題,其中,所述目標用戶問題為目標用戶在所述原始文本對話數據中提問的問題,所述目標用戶的用戶角色為所述目標角色類別。
可選地,所述從所述原始文本對話數據中,獲取目標文本數據,包括:
對所述原始文本對話數據執行數據預處理,獲得預處理文本數據;
將所述預處理文本數據輸入到目標角色分類模型中,獲得所述目標文本數據,其中,所述目標角色分類模型用于預測語句屬于目標角色類別的概率。
可選地,所述將所述預處理文本數據輸入到目標角色分類模型中,獲得所述目標文本數據,包括:
根據所述目標角色分類模型,預測所述預處理文本數據中語句分別對應的概率;
從所述預處理文本數據中提取對應概率不小于預設概率閾值的語句,以獲得所述目標文本數據。
可選地,所述根據所述目標文本數據,獲得目標用戶問題,包括:
使用預設文本摘要抽取算法從所述目標文本數據的語句中,獲得第一待確定語句,其中,所述第一待確定語句為對應語句權重滿足預設條件的語句;
獲取預設關鍵詞匯,其中,所述預設關鍵詞匯用于確定語句是否為用戶問題;
從所述第一待確定語句中,獲取包含所述預設關鍵詞匯中的任一詞匯的語句作為第二待確定語句;
從所述第二待確定語句中,獲取語句位置排序滿足預設位置條件的語句作為所述目標用戶問題,其中,所述語句位置為對應語句在所述目標文本數據中的位置。
可選地,所述使用預設文本摘要抽取算法從所述目標文本數據的語句中,獲得第一待確定語句,包括:
通過分別計算所述目標文本數據中任意兩個語句之間的相似性,構建語句相似性度矩陣;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州云趣信息科技有限公司,未經廣州云趣信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110033442.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種多輪次礫石充填工具
- 下一篇:一種低輸出紋波功率因數校正變換器





