[發(fā)明專利]語音質(zhì)檢方法、裝置、電子設(shè)備及介質(zhì)有效

申請?zhí)枺?/td>	202010158770.4	申請日：	2020-03-09
公開（公告）號：	CN111523317B	公開（公告）日：	2023-04-07
發(fā)明（設(shè)計）人：	趙煥麗;徐國強	申請（專利權(quán)）人：	平安科技（深圳）有限公司
主分類號：	G06F40/289	分類號：	G06F40/289;G06F40/295;G06F40/30;G06Q30/015
代理公司：	深圳市賽恩倍吉知識產(chǎn)權(quán)代理有限公司 44334	代理人：	劉麗華;孫芬
地址：	518000 廣東省深圳市福田區(qū)福***	國省代碼：	廣東;44
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	語音質(zhì)檢方法裝置電子設(shè)備介質(zhì)
鉆瓜網(wǎng) 技術(shù)展會專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【權(quán)利要求書】：

1.一種語音質(zhì)檢方法，其特征在于，所述方法包括：

當接收到待質(zhì)檢音頻時，將所述待質(zhì)檢音頻轉(zhuǎn)換并切割為第一用戶的第一文本及第二用戶的第二文本，包括：基于語音端點檢測技術(shù)，對所述待質(zhì)檢音頻進行處理，得到第一音頻；其中，所述基于語音端點檢測技術(shù)，對所述待質(zhì)檢音頻進行處理，得到第一音頻包括：采用移動窗函數(shù)對所述待質(zhì)檢音頻按照預設(shè)時長進行分割，得到至少一幀語音，對每幀語音進行預處理，根據(jù)每幀預處理后的語音的能量值定位出語音的前端點及后端點，將所述前端點至所述后端點之外的語音刪除，得到所述第一音頻，其中，所述根據(jù)每幀預處理后的語音的能量值定位出語音的前端點及后端點包括：計算每幀預處理后的語音的能量值，當檢測到所述預處理后的語音中連續(xù)預設(shè)幀的能量值小于能量值閾值，及接下來的語音中連續(xù)所述預設(shè)幀的能量值大于所述能量值閾值時，將能量值增大的語音幀確定為所述前端點，當檢測到所述預處理后的語音中連續(xù)所述預設(shè)幀的能量值大于所述能量值閾值，及接下來的語音中連續(xù)所述預設(shè)幀的能量值小于所述能量值閾值時，將能量值減小的語音幀確定為所述后端點，所述第一用戶的語音特征參數(shù)不存在于語音庫中，所述第二用戶的語音特征參數(shù)存在于所述語音庫中；

對所述第一文本及所述第二文本進行標識，得到至少一組對話文本；

對每組對話文本中的第一文本進行預處理，得到每組對話文本中的第一分詞，及對每組對話文本中的第二文本進行預處理，得到每組對話文本中的第二分詞；

將每組對話文本中的第一分詞輸入至預先訓練好的第一參數(shù)抽取模型中，得到每組對話文本中的第一結(jié)果，及將每組對話文本中的第二分詞輸入至預先訓練好的第二參數(shù)抽取模型中，得到每組對話文本中的第二結(jié)果，所述第一結(jié)果包括實體及與所述實體對應(yīng)的實體值，所述第二結(jié)果包括參數(shù)及待測參數(shù)值；

基于每組對話文本，根據(jù)每個第一結(jié)果及每個第二結(jié)果確定所述待質(zhì)檢音頻的匹配率；

確定所述第二結(jié)果中的參數(shù)對應(yīng)的產(chǎn)品，并根據(jù)所述產(chǎn)品從產(chǎn)品庫中提取與所述參數(shù)對應(yīng)的參數(shù)值；

將所述第二結(jié)果中的待測參數(shù)值與所述參數(shù)對應(yīng)的參數(shù)值進行比較，得到比較結(jié)果，根據(jù)所述比較結(jié)果確定所述待質(zhì)檢音頻的準確率；

檢測所述第二文本中是否存在預設(shè)詞，得到所述待質(zhì)檢音頻的檢測結(jié)果，包括：根據(jù)所述預設(shè)詞，遍歷所述第二文本；當在所述第二文本中遍歷到所述預設(shè)詞時，以所述第二文本中存在所述預設(shè)詞作為第一檢測結(jié)果；或者當在所述第二文本中未被遍歷到所述預設(shè)詞時，以所述第二文本中不存在所述預設(shè)詞作為第二檢測結(jié)果；

計算所述匹配率、所述準確率及所述檢測結(jié)果的加權(quán)和作為質(zhì)檢分數(shù)。

2.如權(quán)利要求1所述的語音質(zhì)檢方法，其特征在于，所述將所述待質(zhì)檢音頻轉(zhuǎn)換并切割為第一用戶的第一文本及第二用戶的第二文本包括：

對所述第一音頻進行語音識別，得到文本信息；

從所述第一音頻中提取聲紋特征信息；

將所述聲紋特征信息進行分塊操作，得到特征區(qū)域集；

提取所述特征區(qū)域集中每一幀對應(yīng)的語音特征參數(shù)；

將所述語音特征參數(shù)與語音庫中預存的特征進行語音特征參數(shù)匹配；

將未在所述語音庫中匹配到的語音特征參數(shù)對應(yīng)的文本信息確定為第一用戶的第一文本，及將在所述語音庫中匹配到的語音特征參數(shù)對應(yīng)的文本信息確定為第二用戶的第二文本。

3.如權(quán)利要求1所述的語音質(zhì)檢方法，其特征在于，所述對每組對話文本中的第一文本進行預處理，得到每組對話文本中的第一分詞包括：

根據(jù)預設(shè)的自定義詞典對所述第一文本進行切分，得到切分位置；

根據(jù)所述切分位置，構(gòu)建至少一個有向無環(huán)圖；

根據(jù)所述自定義詞典中的權(quán)值計算每個有向無環(huán)圖的概率；

將概率最大的有向無環(huán)圖對應(yīng)的切分位置確定為目標切分位置；

根據(jù)所述目標切分位置切分所述第一文本；

基于淺層式語義分析方法，對切分后的所述第一文本進行標準化處理，得到特征詞；

確定所述特征詞中的冗余信息；

采用去冗余算法處理所述冗余信息，得到去冗余后的所述第一分詞。

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于平安科技（深圳）有限公司，未經(jīng)平安科技（深圳）有限公司許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202010158770.4/1.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。