[發明專利]語音基音周期檢測方法和裝置有效
| 申請號: | 201210592093.2 | 申請日: | 2012-12-29 |
| 公開(公告)號: | CN103915099A | 公開(公告)日: | 2014-07-09 |
| 發明(設計)人: | 宋輝 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G10L19/09 | 分類號: | G10L19/09;G10L25/90 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙) 11201 | 代理人: | 宋合成 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 基音 周期 檢測 方法 裝置 | ||
1.一種語音基音周期檢測方法,其特征在于,包括以下步驟:?
接收語音輸入信號并對所述語音輸入信號進行預處理,其中,所述語音輸入信號包括多幀語音信號;?
對所述語音輸入信號中的每幀語音信號進行先驗信噪比估計以獲得每幀語音信號對應的先驗信噪比;?
根據每幀語音信號對應的先驗信噪比獲得每幀語音信號對應的權重值;?
提取所述多幀語音信號中的多個基音候選項;?
根據所述多個基音候選項和先驗信噪比按照預設周期對所述多幀語音信號進行第一次動態規劃以獲得多個第一基音路徑及所述第一基音路徑對應的代價信息;?
根據所述第一基音路徑對應的代價信息對所述多個第一基音路徑進行第二次動態規劃以生成至少一個第二基音路徑;以及?
根據所述至少一個第二基音路徑檢測所述語音基音周期。?
2.如權利要求1所述的語音基音周期檢測方法,其特征在于,對所述語音輸入信號進行預處理進一步包括:?
對所述語音輸入信號進行分幀處理,并對所述語音輸入信號進行噪聲估計以獲得當前噪聲估計信息。?
3.如權利要求2所述的語音基音周期檢測方法,其特征在于,對所述語音輸入信號進行預處理還包括:?
對所述語音輸入信號進行預加重、加窗及FFT處理。?
4.如權利要求1-3任一項所述的語音基音周期檢測方法,其特征在于,通過以下公式獲得每幀語音信號對應的先驗信噪比:?
其中,SNRapriori(f,i)表示當前幀語音信號的先驗信噪比,X(f,i-1)表示語音信號的頻譜,N(f)表示噪聲信號的頻譜,i表示幀索引,α表示加權因子,SNRpost表示前一幀的先驗信噪比。?
5.如權利要求4所述的語音基音周期檢測方法,其特征在于,通過以下公式獲得每幀語音信號對應的權重值:?
其中,SNRapriori(f,i)表示當前幀語音信號的先驗信噪比,i表示幀索引,Thrsnr表示預定閾值。?
6.如權利要求1所述的語音基音周期檢測方法,其特征在于,根據相關性檢測方法提取所述多幀語音信號中的多個基音候選項。?
7.如權利要求5所述的語音基音周期檢測方法,其特征在于,所述根據多個基音候選項和先驗信噪比按照預設周期對所述多幀語音信號進行第一次動態規劃以獲得多個第一基音路徑及所述第一基音路徑對應的代價信息進一步包括:?
獲得所述多個基音候選項中每個基音候選項對應的權重值,所述權重值包括第一權重值和第二權重值,其中,所述第一權重值與所述基音候選項對應的先驗信噪比相關,所述第二權重值與相關函數的峰值強度相關。?
8.如權利要求7所述的語音基音周期檢測方法,其特征在于,所述根據第一基音路徑對應的代價信息對所述多個第一基音路徑進行第二次動態規劃以生成至少一個第二基音路徑進一步包括:?
對所述語音輸入信號進行分段以生成多個語音段,其中,每個語音段包括多個第一基音路徑;?
根據代價信息對所述每個語音段中的多個第一基音路徑進行排序;?
選取所述每個語音段中前N個第一基音路徑,N為正整數;以及?
對多個語音段中每個語音段中選擇的前N個第一基音路徑進行第二次動態規劃以生成至少一個第二基音路徑。?
9.如權利要求1所述的語音基音周期檢測方法,其特征在于,還包括:?
對所述至少一個第二基音路徑進行平滑處理。?
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210592093.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:信號處理裝置及其操作方法
- 下一篇:一種蘄蛇水溶性總蛋白凍干粉的制備方法





