[發(fā)明專利]語音質(zhì)檢方法、裝置、電子設(shè)備及介質(zhì)有效
| 申請?zhí)枺?/td> | 202010158770.4 | 申請日: | 2020-03-09 |
| 公開(公告)號: | CN111523317B | 公開(公告)日: | 2023-04-07 |
| 發(fā)明(設(shè)計)人: | 趙煥麗;徐國強 | 申請(專利權(quán))人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06F40/289 | 分類號: | G06F40/289;G06F40/295;G06F40/30;G06Q30/015 |
| 代理公司: | 深圳市賽恩倍吉知識產(chǎn)權(quán)代理有限公司 44334 | 代理人: | 劉麗華;孫芬 |
| 地址: | 518000 廣東省深圳市福田區(qū)福*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 語音 質(zhì)檢 方法 裝置 電子設(shè)備 介質(zhì) | ||
1.一種語音質(zhì)檢方法,其特征在于,所述方法包括:
當接收到待質(zhì)檢音頻時,將所述待質(zhì)檢音頻轉(zhuǎn)換并切割為第一用戶的第一文本及第二用戶的第二文本,包括:基于語音端點檢測技術(shù),對所述待質(zhì)檢音頻進行處理,得到第一音頻;其中,所述基于語音端點檢測技術(shù),對所述待質(zhì)檢音頻進行處理,得到第一音頻包括:采用移動窗函數(shù)對所述待質(zhì)檢音頻按照預設(shè)時長進行分割,得到至少一幀語音,對每幀語音進行預處理,根據(jù)每幀預處理后的語音的能量值定位出語音的前端點及后端點,將所述前端點至所述后端點之外的語音刪除,得到所述第一音頻,其中,所述根據(jù)每幀預處理后的語音的能量值定位出語音的前端點及后端點包括:計算每幀預處理后的語音的能量值,當檢測到所述預處理后的語音中連續(xù)預設(shè)幀的能量值小于能量值閾值,及接下來的語音中連續(xù)所述預設(shè)幀的能量值大于所述能量值閾值時,將能量值增大的語音幀確定為所述前端點,當檢測到所述預處理后的語音中連續(xù)所述預設(shè)幀的能量值大于所述能量值閾值,及接下來的語音中連續(xù)所述預設(shè)幀的能量值小于所述能量值閾值時,將能量值減小的語音幀確定為所述后端點,所述第一用戶的語音特征參數(shù)不存在于語音庫中,所述第二用戶的語音特征參數(shù)存在于所述語音庫中;
對所述第一文本及所述第二文本進行標識,得到至少一組對話文本;
對每組對話文本中的第一文本進行預處理,得到每組對話文本中的第一分詞,及對每組對話文本中的第二文本進行預處理,得到每組對話文本中的第二分詞;
將每組對話文本中的第一分詞輸入至預先訓練好的第一參數(shù)抽取模型中,得到每組對話文本中的第一結(jié)果,及將每組對話文本中的第二分詞輸入至預先訓練好的第二參數(shù)抽取模型中,得到每組對話文本中的第二結(jié)果,所述第一結(jié)果包括實體及與所述實體對應(yīng)的實體值,所述第二結(jié)果包括參數(shù)及待測參數(shù)值;
基于每組對話文本,根據(jù)每個第一結(jié)果及每個第二結(jié)果確定所述待質(zhì)檢音頻的匹配率;
確定所述第二結(jié)果中的參數(shù)對應(yīng)的產(chǎn)品,并根據(jù)所述產(chǎn)品從產(chǎn)品庫中提取與所述參數(shù)對應(yīng)的參數(shù)值;
將所述第二結(jié)果中的待測參數(shù)值與所述參數(shù)對應(yīng)的參數(shù)值進行比較,得到比較結(jié)果,根據(jù)所述比較結(jié)果確定所述待質(zhì)檢音頻的準確率;
檢測所述第二文本中是否存在預設(shè)詞,得到所述待質(zhì)檢音頻的檢測結(jié)果,包括:根據(jù)所述預設(shè)詞,遍歷所述第二文本;當在所述第二文本中遍歷到所述預設(shè)詞時,以所述第二文本中存在所述預設(shè)詞作為第一檢測結(jié)果;或者當在所述第二文本中未被遍歷到所述預設(shè)詞時,以所述第二文本中不存在所述預設(shè)詞作為第二檢測結(jié)果;
計算所述匹配率、所述準確率及所述檢測結(jié)果的加權(quán)和作為質(zhì)檢分數(shù)。
2.如權(quán)利要求1所述的語音質(zhì)檢方法,其特征在于,所述將所述待質(zhì)檢音頻轉(zhuǎn)換并切割為第一用戶的第一文本及第二用戶的第二文本包括:
對所述第一音頻進行語音識別,得到文本信息;
從所述第一音頻中提取聲紋特征信息;
將所述聲紋特征信息進行分塊操作,得到特征區(qū)域集;
提取所述特征區(qū)域集中每一幀對應(yīng)的語音特征參數(shù);
將所述語音特征參數(shù)與語音庫中預存的特征進行語音特征參數(shù)匹配;
將未在所述語音庫中匹配到的語音特征參數(shù)對應(yīng)的文本信息確定為第一用戶的第一文本,及將在所述語音庫中匹配到的語音特征參數(shù)對應(yīng)的文本信息確定為第二用戶的第二文本。
3.如權(quán)利要求1所述的語音質(zhì)檢方法,其特征在于,所述對每組對話文本中的第一文本進行預處理,得到每組對話文本中的第一分詞包括:
根據(jù)預設(shè)的自定義詞典對所述第一文本進行切分,得到切分位置;
根據(jù)所述切分位置,構(gòu)建至少一個有向無環(huán)圖;
根據(jù)所述自定義詞典中的權(quán)值計算每個有向無環(huán)圖的概率;
將概率最大的有向無環(huán)圖對應(yīng)的切分位置確定為目標切分位置;
根據(jù)所述目標切分位置切分所述第一文本;
基于淺層式語義分析方法,對切分后的所述第一文本進行標準化處理,得到特征詞;
確定所述特征詞中的冗余信息;
采用去冗余算法處理所述冗余信息,得到去冗余后的所述第一分詞。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于平安科技(深圳)有限公司,未經(jīng)平安科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010158770.4/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 質(zhì)檢方法、質(zhì)檢設(shè)備及質(zhì)檢系統(tǒng)
- 一種話務(wù)錄音的質(zhì)檢方法及裝置
- 一種智能凈水機線上質(zhì)檢方法、系統(tǒng)
- 質(zhì)檢方法、裝置、設(shè)備及存儲介質(zhì)
- 產(chǎn)品質(zhì)檢方法、裝置、設(shè)備及計算機可讀存儲介質(zhì)
- 一種視頻質(zhì)檢方法、系統(tǒng)及終端設(shè)備
- 智能質(zhì)檢方法、系統(tǒng)、介質(zhì)以及設(shè)備
- 一種語音質(zhì)檢方法、裝置、質(zhì)檢設(shè)備及可讀存儲介質(zhì)
- AI質(zhì)檢方法,裝置,系統(tǒng),電子設(shè)備及存儲介質(zhì)
- 基于知識階層的數(shù)據(jù)質(zhì)檢的方法、裝置及計算機設(shè)備





