[發(fā)明專利]通過語音識(shí)別情緒的方法在審
| 申請(qǐng)?zhí)枺?/td> | 201711362864.8 | 申請(qǐng)日: | 2017-12-18 |
| 公開(公告)號(hào): | CN109935240A | 公開(公告)日: | 2019-06-25 |
| 發(fā)明(設(shè)計(jì))人: | 余世經(jīng);朱頻頻 | 申請(qǐng)(專利權(quán))人: | 上海智臻智能網(wǎng)絡(luò)科技股份有限公司 |
| 主分類號(hào): | G10L25/63 | 分類號(hào): | G10L25/63;G10L25/24;G10L25/21;G10L25/18;G10L25/03 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 201803 上海市嘉*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 語音片段 情緒 情緒特征 語音識(shí)別 音頻特征向量 音頻流 分類 匹配 計(jì)算機(jī)可讀存儲(chǔ)介質(zhì) 呼叫中心系統(tǒng) 計(jì)算機(jī)設(shè)備 匹配結(jié)果 情緒狀態(tài) 實(shí)時(shí)監(jiān)測(cè) 客服 客戶 | ||
本發(fā)明實(shí)施例提供了一種通過語音識(shí)別情緒的方法、計(jì)算機(jī)設(shè)備和計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),解決了現(xiàn)有技術(shù)無法實(shí)時(shí)監(jiān)測(cè)呼叫中心系統(tǒng)中客服和客戶的情緒狀態(tài)的問題。該通過語音識(shí)別情緒的方法包括:提取待識(shí)別音頻流中的語音片段的音頻特征向量,其中語音片段對(duì)應(yīng)待識(shí)別音頻流中的一段話;將語音片段的音頻特征向量與多個(gè)情緒特征模型進(jìn)行匹配,其中多個(gè)情緒特征模型分別對(duì)應(yīng)多個(gè)情緒分類之一;以及將匹配結(jié)果為相匹配的情緒特征模型所對(duì)應(yīng)的情緒分類作為語音片段的情緒分類。
技術(shù)領(lǐng)域
本發(fā)明涉及智能交互技術(shù)領(lǐng)域,具體涉及一種通過語音識(shí)別情緒的方法、計(jì)算機(jī)設(shè)備和計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。
背景技術(shù)
呼叫中心系統(tǒng)是指一種利用現(xiàn)代通訊與計(jì)算機(jī)技術(shù),自動(dòng)靈活地處理大量各種不同的電話呼入/呼出業(yè)務(wù)來實(shí)現(xiàn)服務(wù)運(yùn)營的操作系統(tǒng)。隨著經(jīng)濟(jì)發(fā)展,呼叫中心系統(tǒng)中客服交互的業(yè)務(wù)量也越來越大,及時(shí)和有效的跟蹤和監(jiān)測(cè)客服通話中客服和客戶的情緒狀態(tài),對(duì)于企業(yè)提升其服務(wù)質(zhì)量具有重要的意義。目前,大多數(shù)企業(yè)主要依靠聘請(qǐng)專門的質(zhì)檢人員對(duì)通話錄音進(jìn)行抽樣監(jiān)聽來實(shí)現(xiàn)這一目的,這一方面會(huì)給企業(yè)帶來額外的成本,另一方面由于抽樣覆蓋范圍的不確定性、以及人為判定含有的主觀感情色彩,使得人工質(zhì)檢的效果存在一定的局限性。此外,質(zhì)檢人員只能在通話結(jié)束,獲得錄音以后對(duì)客服和客戶的情緒表現(xiàn)進(jìn)行事后的評(píng)價(jià),而難以做到在通話進(jìn)行當(dāng)中去實(shí)時(shí)的監(jiān)測(cè)客服和客戶的情緒狀態(tài),當(dāng)通話中客服或客戶出現(xiàn)非常負(fù)面的情緒時(shí),也無法及時(shí)有效的對(duì)客服人員進(jìn)行提醒。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明實(shí)施例提供了一種通過語音識(shí)別情緒的方法、計(jì)算機(jī)設(shè)備和計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),解決了現(xiàn)有技術(shù)無法實(shí)時(shí)監(jiān)測(cè)呼叫中心系統(tǒng)中客服和客戶的情緒狀態(tài)的問題。
本發(fā)明一實(shí)施例提供的一種通過語音識(shí)別情緒的方法包括:
提取待識(shí)別音頻流中的語音片段的音頻特征向量,其中所述語音片段對(duì)應(yīng)所述待識(shí)別音頻流中的一段話;
將所述語音片段的音頻特征向量與多個(gè)情緒特征模型進(jìn)行匹配,其中所述多個(gè)情緒特征模型分別對(duì)應(yīng)多個(gè)情緒分類之一,所述多個(gè)情緒特征模型通過對(duì)包括所述多個(gè)情緒分類對(duì)應(yīng)的情緒分類標(biāo)簽的多個(gè)預(yù)設(shè)語音片段各自的音頻特征向量進(jìn)行預(yù)學(xué)習(xí)而建立;以及
將匹配結(jié)果為相匹配的所述情緒特征模型所對(duì)應(yīng)的情緒分類作為所述語音片段的情緒分類;其中,所述音頻特征向量包括以下幾種音頻特征中的一種或多種:能量特征、發(fā)音幀數(shù)特征、基音頻率特征、共振峰特征、諧波噪聲比特征以及梅爾倒譜系數(shù)特征;所述語音片段包括所述待識(shí)別音頻流中的一次客服輸入語音段,所述多個(gè)情緒分類包括:滿意分類、平靜分類以及煩躁分類。
可選地,所述預(yù)學(xué)習(xí)過程包括:
將包括所述多個(gè)情緒分類對(duì)應(yīng)的情緒分類標(biāo)簽的多個(gè)預(yù)設(shè)語音片段各自的音頻特征向量進(jìn)行聚類處理,得到預(yù)設(shè)情緒分類的聚類結(jié)果;以及
根據(jù)所述聚類結(jié)果,將每個(gè)聚類中的所述預(yù)設(shè)語音片段的音頻特征向量訓(xùn)練為一個(gè)所述情緒特征模型。
可選地,當(dāng)所述情緒特征模型為混合高斯模型時(shí),則所述將所述語音片段的音頻特征向量與多個(gè)情緒特征模型進(jìn)行匹配包括:
計(jì)算所述語音片段的音頻特征向量分別與所述多個(gè)情緒特征模型之間的似然概率;
其中,所述將匹配結(jié)果為相匹配的所述情緒特征模型所對(duì)應(yīng)的情緒分類作為所述語音片段的情緒分類包括:
將似然概率大于預(yù)設(shè)閾值且最大的所述情緒特征模型所對(duì)應(yīng)的情緒分類作為所述語音片段的情緒分類。
可選地,在提取待識(shí)別音頻流中的語音片段的音頻特征向量之前,進(jìn)一步包括:
確定所述待識(shí)別音頻流中的語音開始幀以及語音結(jié)束幀;以及
提取所述語音開始幀與所述語音結(jié)束幀之間的音頻流部分作為所述語音片段。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海智臻智能網(wǎng)絡(luò)科技股份有限公司,未經(jīng)上海智臻智能網(wǎng)絡(luò)科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711362864.8/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 語音合成裝置,語音合成方法,以及程序
- 重疊語音檢測(cè)方法和系統(tǒng)
- 一種語音數(shù)據(jù)處理方法及系統(tǒng)
- 會(huì)議內(nèi)容區(qū)分方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 用于處理語音的方法和裝置
- 數(shù)據(jù)處理方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 數(shù)據(jù)采集的方法及裝置
- 語音切割點(diǎn)檢測(cè)方法及其裝置、介質(zhì)和電子設(shè)備
- 有效語音片段檢測(cè)方法、相關(guān)設(shè)備及可讀存儲(chǔ)介質(zhì)
- 一種語音信號(hào)處理方法、裝置、介質(zhì)和設(shè)備
- 股市情緒的確定方法和裝置
- 網(wǎng)絡(luò)情緒的確定方法和裝置
- 品牌情緒的確定方法和裝置
- 一種人臉情緒的識(shí)別方法和識(shí)別裝置、計(jì)算機(jī)可讀介質(zhì)
- 文本情緒呈現(xiàn)方法、文本情緒呈現(xiàn)裝置以及存儲(chǔ)介質(zhì)
- 一種智能工程師情緒監(jiān)測(cè)系統(tǒng)
- 基于深度學(xué)習(xí)和腦機(jī)接口的情緒識(shí)別系統(tǒng)及應(yīng)用
- 一種分析用戶對(duì)話情緒方法、系統(tǒng)、設(shè)備和存儲(chǔ)介質(zhì)
- 一種識(shí)別用戶情緒的方法及相關(guān)裝置
- 一種情緒監(jiān)測(cè)裝置及方法
- 一種情緒文本的情緒特征確定方法及裝置
- 情緒調(diào)控系統(tǒng)及其調(diào)控方法
- 一種情緒調(diào)節(jié)方法、情緒分享方法及裝置
- 一種情緒識(shí)別方法和移動(dòng)終端
- 語音情緒識(shí)別系統(tǒng)
- 語音情緒識(shí)別方法、系統(tǒng)、移動(dòng)終端及存儲(chǔ)介質(zhì)
- 一種情緒識(shí)別的方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 情緒識(shí)別方法及系統(tǒng)
- 一種識(shí)別用戶情緒的方法及相關(guān)裝置
- 情緒識(shí)別方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 語音識(shí)別系統(tǒng)和方法
- 一種語音識(shí)別測(cè)試系統(tǒng)及方法
- 一種語音識(shí)別設(shè)備的更新方法、裝置及系統(tǒng)
- 用于語音識(shí)別的方法和裝置
- 一種基于手機(jī)互聯(lián)的車載語音識(shí)別系統(tǒng)及識(shí)別方法
- 一種基于云計(jì)算與置信度計(jì)算的語音識(shí)別方法與系統(tǒng)
- 語音識(shí)別方法和裝置
- 一種用于調(diào)度機(jī)的語音識(shí)別裝置
- 語音識(shí)別方法、裝置、系統(tǒng)、電子設(shè)備和存儲(chǔ)介質(zhì)
- 模型訓(xùn)練、語音識(shí)別方法及裝置、電子設(shè)備及存儲(chǔ)介質(zhì)





