[發明專利]一種立體聲音頻的處理方法和裝置有效
| 申請號: | 201410263446.3 | 申請日: | 2014-06-13 |
| 公開(公告)號: | CN104053120A | 公開(公告)日: | 2014-09-17 |
| 發明(設計)人: | 王子亮 | 申請(專利權)人: | 福建星網視易信息系統有限公司 |
| 主分類號: | H04S3/00 | 分類號: | H04S3/00 |
| 代理公司: | 福州市倉山區景弘專利代理事務所(普通合伙) 35219 | 代理人: | 林祥翔;呂元輝 |
| 地址: | 350000 福建省福州市倉山區金山*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 立體聲 音頻 處理 方法 裝置 | ||
技術領域
本發明涉及音頻處理領域,更具體地涉及一種立體聲音頻的處理方法和裝置。
背景技術
從立體聲中將人聲和伴奏分離的技術在音頻處理領域有重要而廣泛的應用,例如歌詞的自動識別和校正,就需要以先期的人聲分離作為基礎來進行。歌詞自動識別通常要求輸入處理系統的是單獨的人聲,有伴奏干擾的情況下很難完成,但因為大多數歌曲都同時包含歌聲與樂器伴奏,直接進行是不實際的。
現有技術中涉及從歌曲中提取伴奏、提取人聲或分離伴奏和人聲的方法往往利用的是多數立體聲歌曲中人聲在左右兩個聲道中基本相同的特點,例如,采用將兩個聲道中的信號直接對減的方法來消除人聲。從歌曲中提取人聲的研究還相對較少。其中,利用立體聲歌曲左右聲道信號之間的相關性來提取人聲或伴奏是立體聲音頻研究的一個重要方向。
一種現有的基于立體聲相關聲道提取人聲的技術是對左右聲道相應頻點對的均值信號加權人聲增益,人聲增益與當前頻點對的歸一化互相關值成正比例取值;將加權人聲增益后的左聲道和右聲道的均值信號由頻域轉換為時域提取出人聲。該方法僅僅利用互相關這一特性來區分伴奏與人聲,雖然可以一定程度地抑制伴奏,但結果會殘余伴奏。
因此,如何較大程度地抑制伴奏或人聲部分,成為本領域人員迫切解決的一個技術問題。
發明內容
為此,需要提供一種準確有效地提取音場中不同區域的音頻信號的方法和技術。
為實現上述目的,發明人提供的技術方案如下:
一種立體聲音頻的處理方法,包括步驟:
分別將左聲道和右聲道的時域信號變換為頻域信號;
利用變換得到的頻域信號計算左聲道頻域信號與右聲道頻域信號相應頻點對的幅度比值,將幅度比值在預設范圍內的頻點列為待衰減的頻點;
對待衰減的頻點進行衰減處理;
將處理后的頻域信號逆變換為時域信號。
進一步地,所述的立體聲音頻的處理方法還包括步驟:利用變換得到的頻域信號計算左聲道頻域信號與右聲道頻域信號相應頻點對的相位差,將相位差差值在預設范圍內的頻點也列為待衰減的頻點。
發明人還提供了另一種立體聲音頻的處理方法,包括步驟:
分別將左聲道和右聲道的時域信號變換為頻域信號;
利用變換得到的頻域信號計算左聲道頻域信號與右聲道頻域信號相應頻點對的相位差,將相位差差值在預設范圍內的頻點列為待衰減的頻點。對待衰減的頻點進行衰減處理;
再將處理后的頻域信號逆變換為時域信號。
進一步地,所述的立體聲音頻的處理方法還包括步驟:利用變換得到的頻域信號計算左聲道頻域信號與右聲道頻域信號相應頻點對的幅度比值,將幅度比值在預設范圍內的頻點也列為待衰減的頻點;
在應用上述方法的各實施例中,當只選擇一個條件(幅度比值或相位差)時,可以遍歷所有頻點,當滿足該條件時,直接對該頻點進行衰減處理;當選擇多個條件(幅度比值與相位差)時,可以先篩選出所有符合條件的頻點,然后一并對這些頻點進行衰減處理,比如,先按不同的條件篩選出各自的頻點集合,然后將這些集合取并集,從而得到所有待衰減的點;再比如,先以某個條件篩選出符合條件的頻點集合,然后以其他條件篩選,如果有新的符合條件的頻點,再加入之前那個頻點集合,從而得到所有待衰減的點。
進一步地,所述的立體聲音頻的處理方法中,所述左聲道頻域信號與右聲道頻域信號相應頻點對的幅度比值計算公式如下:kn(i)=abs(fft_frameRn(i))/abs(fft_framLn(i))*(2/π);其中fft_frameRn(i)與fft_framLn(i)分別表示右聲道與左聲道的頻譜;
公式中n=0,1,2,…,N-1;N表示幀數;
i=0,1,2,…,FN/2;FN表示傅里葉變換的點數。
并將幅度比值在預設范圍內的頻點列為待衰減的頻點。
進一步地,所述的立體聲音頻的處理方法中,計算左右聲道相應頻點對的相位差的公式為:
pn(i)=angel(fft_frameLn(i))-angel(fft_frameRn(i));其中fft_frameRn(i)與fft_framLn(i)分別表示右聲道與左聲道的頻譜;
公式中n=0,1,2,…,N-1;N表示幀數;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于福建星網視易信息系統有限公司,未經福建星網視易信息系統有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410263446.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:移動用戶設備、信息識別和推送系統及其方法
- 下一篇:一種智能聽覺輔助設備





