[發明專利]語音信息處理方法在審
| 申請號: | 201711363536.X | 申請日: | 2017-12-18 |
| 公開(公告)號: | CN109935241A | 公開(公告)日: | 2019-06-25 |
| 發明(設計)人: | 余世經;朱頻頻 | 申請(專利權)人: | 上海智臻智能網絡科技股份有限公司 |
| 主分類號: | G10L25/63 | 分類號: | G10L25/63;G10L25/51;G10L25/24;H04M3/51 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 201803 上海市嘉*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音片段 語音信息處理 情緒特征 音頻特征向量 音頻流 分類 匹配 情緒 計算機可讀存儲介質 呼叫中心系統 計算機設備 匹配結果 情緒狀態 實時監測 客服 客戶 | ||
本發明實施例提供了一種語音信息處理方法、計算機設備和計算機可讀存儲介質,解決了現有技術無法實時監測呼叫中心系統中客服和客戶的情緒狀態的問題。該語音信息處理方法包括:提取待識別音頻流中的語音片段的音頻特征向量,其中語音片段對應待識別音頻流中的一段話;將語音片段的音頻特征向量與多個情緒特征模型進行匹配,其中多個情緒特征模型分別對應多個情緒分類之一;以及將匹配結果為相匹配的情緒特征模型所對應的情緒分類作為語音片段的情緒分類。
技術領域
本發明涉及智能交互技術領域,具體涉及一種語音信息處理方法、計算機設備和計算機可讀存儲介質。
背景技術
呼叫中心系統是指一種利用現代通訊與計算機技術,自動靈活地處理大量各種不同的電話呼入/呼出業務來實現服務運營的操作系統。隨著經濟發展,呼叫中心系統中客服交互的業務量也越來越大,及時和有效的跟蹤和監測客服通話中客服和客戶的情緒狀態,對于企業提升其服務質量具有重要的意義。目前,大多數企業主要依靠聘請專門的質檢人員對通話錄音進行抽樣監聽來實現這一目的,這一方面會給企業帶來額外的成本,另一方面由于抽樣覆蓋范圍的不確定性、以及人為判定含有的主觀感情色彩,使得人工質檢的效果存在一定的局限性。此外,質檢人員只能在通話結束,獲得錄音以后對客服和客戶的情緒表現進行事后的評價,而難以做到在通話進行當中去實時的監測客服和客戶的情緒狀態,當通話中客服或客戶出現非常負面的情緒時,也無法及時有效的對客服人員進行提醒。
發明內容
有鑒于此,本發明實施例提供了一種語音信息處理方法、計算機設備和計算機可讀存儲介質,解決了現有技術無法實時監測呼叫中心系統中客服和客戶的情緒狀態的問題。
本發明一實施例提供的一種語音信息處理方法包括:
提取待識別音頻流中的語音片段的音頻特征向量,其中所述語音片段對應所述待識別音頻流中的一段話;
將所述語音片段的音頻特征向量與多個情緒特征模型進行匹配,其中所述多個情緒特征模型分別對應多個情緒分類之一,所述多個情緒特征模型通過對包括所述多個情緒分類對應的情緒分類標簽的多個預設語音片段各自的音頻特征向量進行預學習而建立;以及
將匹配結果為相匹配的所述情緒特征模型所對應的情緒分類作為所述語音片段的情緒分類;其中,所述音頻特征向量包括以下幾種音頻特征中的一種或多種:能量特征、發音幀數特征、基音頻率特征、共振峰特征、諧波噪聲比特征以及梅爾倒譜系數特征;所述語音片段包括所述待識別音頻流中的一次客服輸入語音段,所述多個情緒分類包括:滿意分類、平靜分類以及煩躁分類。
可選地,所述預學習過程包括:
將包括所述多個情緒分類對應的情緒分類標簽的多個預設語音片段各自的音頻特征向量進行聚類處理,得到預設情緒分類的聚類結果;以及
根據所述聚類結果,將每個聚類中的所述預設語音片段的音頻特征向量訓練為一個所述情緒特征模型。
可選地,當所述情緒特征模型為混合高斯模型時,則所述將所述語音片段的音頻特征向量與多個情緒特征模型進行匹配包括:
計算所述語音片段的音頻特征向量分別與所述多個情緒特征模型之間的似然概率;
其中,所述將匹配結果為相匹配的所述情緒特征模型所對應的情緒分類作為所述語音片段的情緒分類包括:
將似然概率大于預設閾值且最大的所述情緒特征模型所對應的情緒分類作為所述語音片段的情緒分類。
可選地,在提取待識別音頻流中的語音片段的音頻特征向量之前,進一步包括:
確定所述待識別音頻流中的語音開始幀以及語音結束幀;以及
提取所述語音開始幀與所述語音結束幀之間的音頻流部分作為所述語音片段。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海智臻智能網絡科技股份有限公司,未經上海智臻智能網絡科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711363536.X/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:通過語音識別情緒的方法
- 下一篇:可打斷式語音處理系統和方法





