[發(fā)明專利]一種基于特定領(lǐng)域的語音打分模型構(gòu)建系統(tǒng)及方法在審
| 申請?zhí)枺?/td> | 202110054518.3 | 申請日: | 2021-01-15 |
| 公開(公告)號: | CN112800743A | 公開(公告)日: | 2021-05-14 |
| 發(fā)明(設(shè)計)人: | 吳亞洲;吳福全;王淋淋 | 申請(專利權(quán))人: | 安徽迪科數(shù)金科技有限公司 |
| 主分類號: | G06F40/205 | 分類號: | G06F40/205;G06F40/216;G06F40/30;G06Q30/00;G10L25/27;G10L25/60 |
| 代理公司: | 合肥正則元起專利代理事務(wù)所(普通合伙) 34160 | 代理人: | 周衛(wèi) |
| 地址: | 230000 安徽省合肥市*** | 國省代碼: | 安徽;34 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 特定 領(lǐng)域 語音 打分 模型 構(gòu)建 系統(tǒng) 方法 | ||
1.一種基于特定領(lǐng)域的語音打分模型構(gòu)建系統(tǒng),其特征在于,包括測試采集模塊、服務(wù)器、數(shù)據(jù)分析模塊和模型構(gòu)建模塊;
所述測試采集模塊用于采集在特定領(lǐng)域下測試的語音并將語音發(fā)送至服務(wù)器內(nèi);其中,特定領(lǐng)域測試的語音包括跟讀場景下測試的語音及情景對練模式下測試的語音;
所述服務(wù)器將接收到的語音分配至對應(yīng)工作人員電腦終端上,工作人員電腦終端內(nèi)安裝有數(shù)據(jù)分析模塊;
所述數(shù)據(jù)分析模塊用于分析特定領(lǐng)域下測試的語音得到評分維度,數(shù)據(jù)分析模塊將分析的評分維度發(fā)送至模型構(gòu)建模塊;模型構(gòu)建模塊將接收到評分維度的時刻標(biāo)記為分析完成時刻;其中,數(shù)據(jù)分析模塊分析包括內(nèi)容相關(guān)性分析、表達(dá)流利性分析和場景流暢性分析;
所述模型構(gòu)建模塊用于對評分維度進(jìn)行模型構(gòu)建,具體為:獲取模型對應(yīng)的評分維度,每個評分維度均對應(yīng)一個預(yù)設(shè)分,將模型對應(yīng)的評分維度與所有評分維度進(jìn)行匹配獲取得到對應(yīng)的預(yù)設(shè)分,將模型匹配到的所有預(yù)設(shè)分進(jìn)行求和得到總分;其中,評分維度包括關(guān)鍵詞覆蓋率、語義覆蓋率、質(zhì)檢差錯值、語量、字錯率和停頓頻率。
2.根據(jù)權(quán)利要求1所述的一種基于特定領(lǐng)域的語音打分模型構(gòu)建系統(tǒng),其特征在于,所述跟讀場景下測試的語音為應(yīng)答者大聲朗讀測試提示中提示的所有內(nèi)容的語音;客戶回答與坐席回答一一對應(yīng);所述情景對練模式下測試的語音為限定某個場景下,坐席員按照指定的對話流程進(jìn)行溝通的語音,當(dāng)坐席員對話第一次偏離流程時,提示坐席員應(yīng)該說話的關(guān)鍵信息;若在提示關(guān)鍵信息后,坐席員仍偏離流程,則對坐席員應(yīng)該說的話進(jìn)行完整信息提示;若第三次仍然未通過,則停止當(dāng)前對話,結(jié)束流程。
3.根據(jù)權(quán)利要求2所述的一種基于特定領(lǐng)域的語音打分模型構(gòu)建系統(tǒng),其特征在于,所述內(nèi)容相關(guān)性分析包括關(guān)鍵詞覆蓋率計算、語義覆蓋率計算、質(zhì)檢差錯值計算和語量計算;
所述關(guān)鍵詞覆蓋率計算的具體過程為:識別語音中出現(xiàn)關(guān)鍵詞,將語音中出現(xiàn)關(guān)鍵詞的數(shù)量與預(yù)設(shè)關(guān)鍵詞數(shù)量進(jìn)行比值計算得到關(guān)鍵詞覆蓋率KCR;取值范圍為[0,1],具體表現(xiàn)為:給定一組關(guān)鍵詞,關(guān)鍵詞的數(shù)量為n個,采用語音關(guān)鍵詞檢索技術(shù)檢索應(yīng)答者答題語音中是否存在與其發(fā)音相同的詞語,發(fā)音相同詞語的數(shù)量m個,然后通過式子KCR=m/n獲取得到關(guān)鍵詞覆蓋率KCR;
所述語義覆蓋率計算的具體過程為:對坐席員的語音進(jìn)行語義標(biāo)簽標(biāo)記,語義標(biāo)簽包括策略、施壓類型、針對客戶問題的回答、核身身份和三方轉(zhuǎn)告;具體表現(xiàn)為:當(dāng)某輪對話中坐席話術(shù)預(yù)先設(shè)置了A個語義標(biāo)簽時,而應(yīng)答者回答的內(nèi)容中監(jiān)聽了B個語義標(biāo)簽;則語義覆蓋率KCS=A/B;
所述質(zhì)檢差錯值計算的具體過程為:將坐席員的語音轉(zhuǎn)寫為文本,將撰寫的文本與質(zhì)檢數(shù)據(jù)庫進(jìn)行比對,質(zhì)檢數(shù)據(jù)庫內(nèi)包括若干個質(zhì)檢項;每個質(zhì)檢項均對應(yīng)預(yù)設(shè)評分項;將文本與質(zhì)檢項進(jìn)行比對,當(dāng)文本匹配到對應(yīng)的質(zhì)檢項,則將所有匹配到的質(zhì)檢項進(jìn)行求和得到質(zhì)檢差錯值;
所述語量計算的的具體過程為:將坐席員的語音轉(zhuǎn)換成文字并統(tǒng)計文字的字?jǐn)?shù)得到語量。
4.根據(jù)權(quán)利要求3所述的一種基于特定領(lǐng)域的語音打分模型構(gòu)建系統(tǒng),其特征在于,所述表達(dá)流利性分析包括發(fā)音標(biāo)準(zhǔn)分析、停頓分析和重復(fù)糾正分析;所述發(fā)音標(biāo)準(zhǔn)分析的具體過程為:通過ASR對語音識別,統(tǒng)計ASR識別后的字錯率;
所述停頓分析的具體過程為:對坐席員的一段語音進(jìn)行有填補(bǔ)性停頓識別,填補(bǔ)性停頓識別為嗯、啊、呢填充音出現(xiàn)的數(shù)量;同時統(tǒng)計一段語音中靜音時長超過或等于0.3秒的次數(shù);將填充音出現(xiàn)的數(shù)量加上靜音時長超過或等于0.3秒的次數(shù)等于總停頓個數(shù),利用公式停頓頻率=總停頓個數(shù)/發(fā)音持續(xù)的總時間得到停頓頻率;
所述重復(fù)糾正分析的具體過程為:對語音中的單詞、詞組或句子進(jìn)行識別,統(tǒng)計被重新說一遍且不對句法、詞形或詞序有所改動的單詞、詞組或句子的重復(fù)數(shù)量。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于安徽迪科數(shù)金科技有限公司,未經(jīng)安徽迪科數(shù)金科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110054518.3/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





