[發(fā)明專利]一種音頻信號(hào)檢測方法和裝置無效
| 申請(qǐng)?zhí)枺?/td> | 201210151383.3 | 申請(qǐng)日: | 2009-10-15 |
| 公開(公告)號(hào): | CN102693720A | 公開(公告)日: | 2012-09-26 |
| 發(fā)明(設(shè)計(jì))人: | 王喆 | 申請(qǐng)(專利權(quán))人: | 華為技術(shù)有限公司 |
| 主分類號(hào): | G10L11/00 | 分類號(hào): | G10L11/00 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 518129 廣東*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 音頻 信號(hào) 檢測 方法 裝置 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及音頻領(lǐng)域的信號(hào)檢測技術(shù),尤其是一種音頻信號(hào)檢測方法和裝置。
背景技術(shù)
在通信系統(tǒng)中,通常對(duì)輸入的音頻信號(hào)進(jìn)行編碼后傳輸?shù)綄?duì)端。在通信系統(tǒng)中,尤其是無線/移動(dòng)通信系統(tǒng)中,信道帶寬是一個(gè)比較稀缺的資源。在一個(gè)雙向的通話中,某一方說話的時(shí)間大概只占總通話時(shí)間的一半左右,另一半都處在靜音狀態(tài)。在信道帶寬比較緊張的情況下,如果通信系統(tǒng)只在人說話的時(shí)候傳輸信號(hào),而在靜音時(shí)停止信號(hào)的傳輸,將可以節(jié)省出大量的帶寬分配給其它用戶。為了達(dá)到這個(gè)目的,通信系統(tǒng)需要知道通話人何時(shí)開始說話,何時(shí)停止說話,即需要知道語音何時(shí)是激活的,這就需要語音激活檢測(voice?activity?detection,VAD)。一般在語音激活時(shí),語音編碼器會(huì)采用較高的速率編碼,而在無語音的背景信號(hào)階段,編碼器會(huì)采用較低的速率編碼。通過語音激活檢測技術(shù),通信系統(tǒng)能夠區(qū)分輸入的音頻信號(hào)是語音還是背景噪音,并采用不同的編碼技術(shù)進(jìn)行編碼。
這種體制在通常的背景環(huán)境下都是可行的,但是當(dāng)背景信號(hào)是音樂信號(hào)時(shí),較低速率的編碼會(huì)極大的影響聽者的主觀感受。因此一種新的需求被提出來,即VAD系統(tǒng)需要能夠有效的識(shí)別出背景音樂的場景,并有針對(duì)性的提高背景音樂的編碼質(zhì)量。
在AMR?VAD1中,有一種檢測復(fù)雜信號(hào)的技術(shù),一般來說,這里的復(fù)雜信號(hào)就是指音樂信號(hào)。在該VAD中,對(duì)每一幀信號(hào),從AMR編碼器中獲得該幀的最大相關(guān)向量best_corr_hpm,并將其歸一化在[0-1]的范圍之內(nèi)。對(duì)歸一化后的最大相關(guān)向量best_corr_hpm求其長時(shí)的滑動(dòng)平均相關(guān)向量corr_hp,計(jì)算方法為:
corr_hp=α·corr_hp+(1-α)·best_corr_hpm,
其中α為取值范圍在[0.8,0.98]之間的遺忘系數(shù)
將每幀的corr_hp都與一高一低兩個(gè)門限進(jìn)行比較,如果出現(xiàn)連續(xù)8幀corr_hp都高于高門限的幀時(shí),或者出現(xiàn)連續(xù)15幀corr_hp都高于低門限的幀時(shí),則一個(gè)復(fù)雜信號(hào)標(biāo)志complex_warning被設(shè)為1,表示復(fù)雜信號(hào)被檢測到了。
發(fā)明人在實(shí)現(xiàn)本發(fā)明的過程中,發(fā)現(xiàn)現(xiàn)有技術(shù)至少存在以下缺點(diǎn):
上述技術(shù)雖然可以檢測出音樂信號(hào),但是并不能區(qū)分出是前景音樂還是背景音樂,因而不能根據(jù)帶寬情況對(duì)背景音樂信號(hào)采用適合的編碼技術(shù)。并且,上述技術(shù)可能把一些常規(guī)的背景噪聲如babble噪聲也當(dāng)做是復(fù)雜信號(hào),從而較大的影響了節(jié)省帶寬。
發(fā)明內(nèi)容
本發(fā)明的實(shí)施例提供一種音頻信號(hào)檢測方法和裝置,能夠從音頻信號(hào)中檢測出背景音樂。
根據(jù)本發(fā)明的一實(shí)施例,提供一種音頻信號(hào)檢測方法,包括:
將輸入的音頻信號(hào)分為多個(gè)音頻信號(hào)幀;
對(duì)每一幀音頻信號(hào)幀進(jìn)行前景/背景檢測;
當(dāng)檢測到背景信號(hào)幀時(shí),將一個(gè)背景幀計(jì)數(shù)器加上一個(gè)步長值;獲得所述背景信號(hào)幀的音樂特征值,將所述音樂特征值累加到一個(gè)背景音樂特征累加值;
當(dāng)背景幀計(jì)數(shù)器達(dá)到一個(gè)預(yù)先設(shè)定的數(shù)量時(shí),將背景音樂特征累加值與一個(gè)門限做比較,當(dāng)背景音樂特征累加值符合門限判定法則時(shí),則檢測到背景音樂。
根據(jù)本發(fā)明的另一實(shí)施例,提供一種編碼器,包括:
背景幀識(shí)別器,用于對(duì)輸入的每一幀音頻信號(hào)進(jìn)行檢測,輸出背景信號(hào)幀或前景信號(hào)幀的檢測結(jié)果;
背景音樂識(shí)別器,用于當(dāng)檢測到背景信號(hào)幀時(shí),根據(jù)所述背景信號(hào)幀的音樂特征值對(duì)所述背景信號(hào)幀進(jìn)行檢測,輸出檢測到背景音樂的檢測結(jié)果;其中,所述背景音樂識(shí)別器包括:
背景幀計(jì)數(shù)器,用于當(dāng)檢測到背景信號(hào)幀時(shí),將步長值加到其值上;
音樂特征值獲得單元,用于獲得所述背景信號(hào)幀的音樂特征值;
音樂特征值累加器,用于累加所述音樂特征值;
判決器,用于在背景幀計(jì)數(shù)器達(dá)到預(yù)先設(shè)定的數(shù)量時(shí),確定背景特征累加值符合門限判定法則,輸出檢測到背景音樂的檢測結(jié)果。
本發(fā)明實(shí)施例,對(duì)于背景信號(hào)進(jìn)一步的根據(jù)音樂特征值進(jìn)行判斷,從而能夠檢測出背景音樂,提高語音/音樂分類器的分類性能;并能夠提供更加靈活的對(duì)背景音樂的處理方案,有針對(duì)性的調(diào)整背景音樂的編碼質(zhì)量。
附圖說明
為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于華為技術(shù)有限公司,未經(jīng)華為技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210151383.3/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 自動(dòng)配置藍(lán)牙A2DP傳輸音頻編碼格式的方法和系統(tǒng)
- 一種多路音頻處理方法、音頻播放終端及音頻接收裝置
- 一種音頻處理方法、裝置及終端設(shè)備
- 一種音頻質(zhì)量的檢測方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 音頻分離方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種音頻播放方法、裝置、以及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 一種音頻錄制系統(tǒng)
- 一種音頻共享系統(tǒng)及方法
- 音頻樣本生成方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 音頻處理方法和裝置
- 信號(hào)調(diào)制方法、信號(hào)調(diào)制裝置、信號(hào)解調(diào)方法和信號(hào)解調(diào)裝置
- 亮度信號(hào)/色信號(hào)分離裝置和亮度信號(hào)/色信號(hào)分離方法
- 信號(hào)調(diào)制方法、信號(hào)調(diào)制裝置、信號(hào)解調(diào)方法和信號(hào)解調(diào)裝置
- 信號(hào)調(diào)制方法、信號(hào)調(diào)制裝置、信號(hào)解調(diào)方法和信號(hào)解調(diào)裝置
- 雙耳信號(hào)的信號(hào)生成
- 雙耳信號(hào)的信號(hào)生成
- 信號(hào)處理裝置、信號(hào)處理方法、信號(hào)處理程序
- USBTYPEC信號(hào)轉(zhuǎn)HDMI信號(hào)的信號(hào)轉(zhuǎn)換線
- 信號(hào)盒(信號(hào)轉(zhuǎn)換)
- 信號(hào)調(diào)制方法、信號(hào)調(diào)制裝置、信號(hào)解調(diào)方法和信號(hào)解調(diào)裝置
- 一種數(shù)據(jù)庫讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測試終端的測試方法
- 一種服裝用人體測量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





