[發明專利]一種歌聲位置檢測方法及裝置有效
| 申請號: | 201410109432.6 | 申請日: | 2014-03-21 |
| 公開(公告)號: | CN104091600A | 公開(公告)日: | 2014-10-08 |
| 發明(設計)人: | 孔令城 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G10L25/03 | 分類號: | G10L25/03;G10L25/48 |
| 代理公司: | 深圳市深佳知識產權代理事務所(普通合伙) 44285 | 代理人: | 王仲凱 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 歌聲 位置 檢測 方法 裝置 | ||
1.一種歌聲位置檢測方法,其特征在于,包括:
獲取待檢測歌曲或經過至少一次處理后的待檢測歌曲中當前幀歌曲的特征,所述待檢測歌曲劃分為多幀歌曲;
如果所述當前幀歌曲的特征滿足預置的第一策略,儲存所述當前幀歌曲的標識信息;
將所述待檢測歌曲的所有幀歌曲中,特征滿足預置的第二策略的第一個幀歌曲的標識信息,與儲存的所述標識信息進行比較,選擇某一標識信息對應幀歌曲所在位置作為所述待檢測歌曲中包含歌聲的位置;
其中,所述選擇的標識信息對應幀歌曲排在所述待檢測歌曲較后的位置。
2.如權利要求1所述的方法,其特征在于,所述獲取的待檢測歌曲中當前幀歌曲的特征包括:能量特征、過零率和譜通量;
所述預置的第一策略包括:一幀歌曲的能量大于預置的第一閾值,過零率大于預置的第二閾值,且譜通量大于預置的第三閾值;
所述預置的第二策略包括:一幀歌曲的某一特征大于預置的值。
3.如權利要求1所述的方法,其特征在于,所述獲取待檢測歌曲或經過至少一次處理后的待檢測歌曲中當前幀歌曲的特征之后,還包括:
如果所述當前幀歌曲為所述待檢測歌曲中前段部分歌曲,則對獲取的所述當前幀歌曲的特征進行抑制。
4.如權利要求2或3所述的方法,其特征在于,如果所述特征為能量特征,則所述獲取待檢測歌曲中當前幀歌曲的特征,具體包括:
計算所述當前幀歌曲的信號的平方和;
用所述平方和與所述待檢測歌曲中所有幀歌曲的信號的平方和的最大值的商作為所述當前幀歌曲的能量特征。
5.如權利要求2或3所述的方法,其特征在于,如果所述特征為過零率,則所述獲取待檢測歌曲中當前幀歌曲的特征,具體包括:
計算所述當前幀歌曲的信號中樣本改變符號的次數;
用所述次數與所述待檢測歌曲中所有幀歌曲的信號對應樣本改變符號次數的最大值的商作為所述當前幀歌曲的過零率。
6.如權利要求4或5所述的方法,其特征在于,所述獲取待檢測歌曲中當前幀歌曲的特征之前,還包括:
對所述待檢測歌曲進行帶通濾波;
所述獲取經過至少一次處理后的待檢測歌曲中當前幀歌曲的特征,具體包括:獲取經過所述帶通濾波后的待檢測歌曲中當前幀歌曲的特征。
7.如權利要求2或3所述的方法,其特征在于,如果所述特征為譜通量,則所述獲取待檢測歌曲中當前幀歌曲的特征,具體包括:
計算所述當前幀歌曲的信號與前一幀歌曲的信號歸一化頻譜系數的差的平方和,并將所述平方和作為所述當前幀歌曲的譜通量。
8.一種歌聲位置檢測裝置,其特征在于,包括:
特征獲取單元,用于獲取待檢測歌曲或經過至少一次處理后的待檢測歌曲中當前幀歌曲的特征,所述待檢測歌曲劃分為多幀歌曲;
儲存單元,用于如果所述特征獲取單元獲取的當前幀歌曲的特征滿足預置的第一策略,儲存所述當前幀歌曲的標識信息;
比較選擇單元,用于將所述待檢測歌曲的所有幀歌曲中,特征滿足預置的第二策略的第一個幀歌曲的標識信息,與儲存單元儲存的所述標識信息進行比較,選擇某一標識信息對應幀歌曲所在位置作為所述待檢測歌曲中包含歌聲的位置;
其中,所述選擇的標識信息對應幀歌曲排在所述待檢測歌曲較后的位置。
9.如權利要求8所述的裝置,其特征在于,還包括:
抑制單元,用于如果所述當前幀歌曲為所述待檢測歌曲中前段部分歌曲,則對獲取的所述當前幀歌曲的特征進行抑制。
10.如權利要求8或9所述的裝置,其特征在于,所述特征獲取單元,具體包括:
能量特征計算單元,用于計算所述當前幀歌曲的信號的平方和;用所述平方和與所述待檢測歌曲中所有幀歌曲的信號的平方和的最大值的商作為所述當前幀歌曲的能量特征;
過零計算單元,用于計算所述當前幀歌曲的信號中樣本改變符號的次數;用所述次數與所述待檢測歌曲中所有幀歌曲的信號對應樣本改變符號次數的最大值的商作為所述當前幀歌曲的過零率。
11.如權利要求10所述的裝置,其特征在于,還包括:
濾波單元,用于對所述待檢測歌曲進行帶通濾波;
則所述特征獲取單元,具體用于獲取經過所述帶通濾波后的待檢測歌曲中當前幀歌曲的特征。
12.如權利要求8或9所述的裝置,其特征在于,所述特征獲取單元,具體包括:
譜通量計算單元,用于計算所述當前幀歌曲的信號與前一幀歌曲的信號歸一化頻譜系數的差的平方和,并將所述平方和作為所述當前幀歌曲的譜通量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410109432.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種基于IOS設備的視頻編輯方法及裝置
- 下一篇:單簧管吹口





