[發明專利]一種語音信號相似度檢測方法有效
| 申請號: | 201610756211.7 | 申請日: | 2016-08-30 |
| 公開(公告)號: | CN106328168B | 公開(公告)日: | 2019-10-18 |
| 發明(設計)人: | 張洪英;張杰良;成立然;鄭澤俊 | 申請(專利權)人: | 成都普創通信技術股份有限公司 |
| 主分類號: | G10L25/51 | 分類號: | G10L25/51;G10L21/0208 |
| 代理公司: | 成都行之專利代理事務所(普通合伙) 51220 | 代理人: | 郭受剛 |
| 地址: | 610000 四*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音片段 語音信號 基準語音 待測通道 相似度 相似度檢測 基準通道 平均值計算 語音相似度 性能方面 準確率 排序 衡量 檢測 應用 | ||
本發明公開了一種語音信號相似度檢測方法,包括以下步驟:步驟1、將基準通道中基準語音信號和待測通道中待測語音信號均提取得到N段語音片段,對N段基準語音信號的語音片段和N段待測語音信號的語音片段分別進行排序,并使N段基準語音信號的語音片段與N段待測語音信號的語音片段一一對應;步驟2、逐一計算每段待測語音信號的語音片段及其對應的基準語音信號的語音片段的相似度;步驟3、待N段待測語音信號的語音片段及其對應的基準語音信號的語音片段的相似度均計算完成后,采用累積平均值計算方法計算累積相似度平均值。本發明應用時能提升檢測待測通道相對于基準通道的語音相似度的準確率,進而便于在衡量待測通道性能方面進行推廣應用。
技術領域
本發明涉及音頻處理技術領域,具體是一種語音信號相似度檢測方法。
背景技術
音頻是多媒體應用的一種重要媒體,人們能聽見的音頻信號的頻率范圍大約在20Hz~20kHz,而其中語音信號大約分布在300Hz~4kHz之內。在音頻信號的傳輸過程中常常會涉及信號傳輸通道性能的檢測,目前人們普遍通過檢測待測通道與基準通道兩者語音片段相似度來測試待測通道的性能。采用現有方式檢測語音片段相似度時,受偶發性噪聲干擾的影響,檢測的準確率較低,衡量待測通道性能時參考意義不大。
發明內容
本發明的目的在于克服現有技術的不足,提供了一種語音信號相似度檢測方法,其能提升檢測待測通道相對于基準通道的語音相似度的準確率,進而便于在衡量待測通道性能方面進行推廣應用。
本發明的目的主要通過以下技術方案實現:一種語音信號相似度檢測方法,包括以下步驟:
步驟1、將基準通道中基準語音信號和待測通道中待測語音信號均提取得到N段語音片段,對N段基準語音信號的語音片段和N段待測語音信號的語音片段分別進行排序,并使N段基準語音信號的語音片段與N段待測語音信號的語音片段一一對應;其中,N為不小于2的整數;
步驟2、逐一計算每段待測語音信號的語音片段及其對應的基準語音信號的語音片段的相似度;
步驟3、待N段待測語音信號的語音片段及其對應的基準語音信號的語音片段的相似度均計算完成后,采用累積平均值計算方法計算累積相似度平均值。本發明通過對語音信號連續采集,獲取連續片段,取片段相似度的累積算術平均值,以抵消偶發性噪聲干擾。
進一步的,所述步驟1中提取基準語音信號和待測語音信號兩者的語音片段時包括以下步驟:
步驟1.1、分幀,其中,每幀語音信號對應一段語音片段;
步驟1.2、加矩形窗形成加窗信號,計算短時平均過零率;
步驟1.3、計算短時能量,并調整能量門限;
步驟1.4、端點檢測,并提取語音片段。語音信號是連續的信號,本發明通過分幀將一次接收到的一大塊語音信號分割成多個小塊語音信號進行處理。本發明通過計算短時平均過零率(即計算每幀內信號通過零值的次數)來反應頻率信息,得到頻譜特性。因語音信號的能量隨時間變化較明顯,而短時能量能有效的判斷信號幅度的大小,故本發明通過計算短時能量,用于有聲或無聲的判斷。因語音信號的能量隨時間變化比較明顯,故本發明在判斷信號是有聲還是無聲時,對每幀的信號門限做出了相應的調整。本發明在端點檢測時,具體根據步驟1.2中計算的短時平均過零率和步驟1.3中計算的短時能量,與每幀數據做比較來判斷是否是語音信號。
進一步的,所述步驟1.2中計算短時平均過零率的公式為:
其中,Zn為短時平均過零率,m為經矩形窗處理后數據的索引,n為原始信號數據索引,x(m)為經過加窗處理后的信號。
進一步的,所述步驟1.3中計算短時能量的公式為:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于成都普創通信技術股份有限公司,未經成都普創通信技術股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610756211.7/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種基于語音的應用切換方法及裝置
- 下一篇:桌子





