[發(fā)明專利]一種語音信號相似度檢測方法有效
| 申請?zhí)枺?/td> | 201610756211.7 | 申請日: | 2016-08-30 |
| 公開(公告)號: | CN106328168B | 公開(公告)日: | 2019-10-18 |
| 發(fā)明(設(shè)計)人: | 張洪英;張杰良;成立然;鄭澤俊 | 申請(專利權(quán))人: | 成都普創(chuàng)通信技術(shù)股份有限公司 |
| 主分類號: | G10L25/51 | 分類號: | G10L25/51;G10L21/0208 |
| 代理公司: | 成都行之專利代理事務(wù)所(普通合伙) 51220 | 代理人: | 郭受剛 |
| 地址: | 610000 四*** | 國省代碼: | 四川;51 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 語音片段 語音信號 基準語音 待測通道 相似度 相似度檢測 基準通道 平均值計算 語音相似度 性能方面 準確率 排序 衡量 檢測 應(yīng)用 | ||
本發(fā)明公開了一種語音信號相似度檢測方法,包括以下步驟:步驟1、將基準通道中基準語音信號和待測通道中待測語音信號均提取得到N段語音片段,對N段基準語音信號的語音片段和N段待測語音信號的語音片段分別進行排序,并使N段基準語音信號的語音片段與N段待測語音信號的語音片段一一對應(yīng);步驟2、逐一計算每段待測語音信號的語音片段及其對應(yīng)的基準語音信號的語音片段的相似度;步驟3、待N段待測語音信號的語音片段及其對應(yīng)的基準語音信號的語音片段的相似度均計算完成后,采用累積平均值計算方法計算累積相似度平均值。本發(fā)明應(yīng)用時能提升檢測待測通道相對于基準通道的語音相似度的準確率,進而便于在衡量待測通道性能方面進行推廣應(yīng)用。
技術(shù)領(lǐng)域
本發(fā)明涉及音頻處理技術(shù)領(lǐng)域,具體是一種語音信號相似度檢測方法。
背景技術(shù)
音頻是多媒體應(yīng)用的一種重要媒體,人們能聽見的音頻信號的頻率范圍大約在20Hz~20kHz,而其中語音信號大約分布在300Hz~4kHz之內(nèi)。在音頻信號的傳輸過程中常常會涉及信號傳輸通道性能的檢測,目前人們普遍通過檢測待測通道與基準通道兩者語音片段相似度來測試待測通道的性能。采用現(xiàn)有方式檢測語音片段相似度時,受偶發(fā)性噪聲干擾的影響,檢測的準確率較低,衡量待測通道性能時參考意義不大。
發(fā)明內(nèi)容
本發(fā)明的目的在于克服現(xiàn)有技術(shù)的不足,提供了一種語音信號相似度檢測方法,其能提升檢測待測通道相對于基準通道的語音相似度的準確率,進而便于在衡量待測通道性能方面進行推廣應(yīng)用。
本發(fā)明的目的主要通過以下技術(shù)方案實現(xiàn):一種語音信號相似度檢測方法,包括以下步驟:
步驟1、將基準通道中基準語音信號和待測通道中待測語音信號均提取得到N段語音片段,對N段基準語音信號的語音片段和N段待測語音信號的語音片段分別進行排序,并使N段基準語音信號的語音片段與N段待測語音信號的語音片段一一對應(yīng);其中,N為不小于2的整數(shù);
步驟2、逐一計算每段待測語音信號的語音片段及其對應(yīng)的基準語音信號的語音片段的相似度;
步驟3、待N段待測語音信號的語音片段及其對應(yīng)的基準語音信號的語音片段的相似度均計算完成后,采用累積平均值計算方法計算累積相似度平均值。本發(fā)明通過對語音信號連續(xù)采集,獲取連續(xù)片段,取片段相似度的累積算術(shù)平均值,以抵消偶發(fā)性噪聲干擾。
進一步的,所述步驟1中提取基準語音信號和待測語音信號兩者的語音片段時包括以下步驟:
步驟1.1、分幀,其中,每幀語音信號對應(yīng)一段語音片段;
步驟1.2、加矩形窗形成加窗信號,計算短時平均過零率;
步驟1.3、計算短時能量,并調(diào)整能量門限;
步驟1.4、端點檢測,并提取語音片段。語音信號是連續(xù)的信號,本發(fā)明通過分幀將一次接收到的一大塊語音信號分割成多個小塊語音信號進行處理。本發(fā)明通過計算短時平均過零率(即計算每幀內(nèi)信號通過零值的次數(shù))來反應(yīng)頻率信息,得到頻譜特性。因語音信號的能量隨時間變化較明顯,而短時能量能有效的判斷信號幅度的大小,故本發(fā)明通過計算短時能量,用于有聲或無聲的判斷。因語音信號的能量隨時間變化比較明顯,故本發(fā)明在判斷信號是有聲還是無聲時,對每幀的信號門限做出了相應(yīng)的調(diào)整。本發(fā)明在端點檢測時,具體根據(jù)步驟1.2中計算的短時平均過零率和步驟1.3中計算的短時能量,與每幀數(shù)據(jù)做比較來判斷是否是語音信號。
進一步的,所述步驟1.2中計算短時平均過零率的公式為:
其中,Zn為短時平均過零率,m為經(jīng)矩形窗處理后數(shù)據(jù)的索引,n為原始信號數(shù)據(jù)索引,x(m)為經(jīng)過加窗處理后的信號。
進一步的,所述步驟1.3中計算短時能量的公式為:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于成都普創(chuàng)通信技術(shù)股份有限公司,未經(jīng)成都普創(chuàng)通信技術(shù)股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610756211.7/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種基于語音的應(yīng)用切換方法及裝置
- 下一篇:桌子





