[發(fā)明專利]自動(dòng)增益控制有效
| 申請(qǐng)?zhí)枺?/td> | 201210586362.4 | 申請(qǐng)日: | 2012-11-14 |
| 公開(公告)號(hào): | CN103124165A | 公開(公告)日: | 2013-05-29 |
| 發(fā)明(設(shè)計(jì))人: | S·拉查佩勒;A·克耶爾達(dá)斯 | 申請(qǐng)(專利權(quán))人: | 谷歌公司 |
| 主分類號(hào): | H03G3/20 | 分類號(hào): | H03G3/20 |
| 代理公司: | 中國(guó)專利代理(香港)有限公司 72001 | 代理人: | 蔣駿;李浩 |
| 地址: | 美國(guó)加利*** | 國(guó)省代碼: | 美國(guó);US |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 自動(dòng)增益控制 | ||
技術(shù)領(lǐng)域
本公開涉及調(diào)整應(yīng)用到音頻流的增益。
背景技術(shù)
原始音頻信號(hào)是在麥克風(fēng)處接收的所有頻率的卷積,并且被轉(zhuǎn)換為音頻信號(hào)。在多講話者環(huán)境中,這種頻率卷積包括用于每個(gè)講話者的語(yǔ)音模式,其能夠使音頻系統(tǒng)通過處理所述音頻信號(hào)并識(shí)別用于當(dāng)前講話者的相關(guān)聯(lián)的語(yǔ)音模式來(lái)識(shí)別該當(dāng)前講話者。
發(fā)明內(nèi)容
在一個(gè)示例中,一種方法包括使用音頻系統(tǒng)來(lái)處理音頻信號(hào)以識(shí)別第一講話者。所述方法還包括確定所述音頻系統(tǒng)是否存儲(chǔ)了所述第一講話者和增益之間的關(guān)聯(lián),并且當(dāng)所述音頻系統(tǒng)沒有存儲(chǔ)所述第一講話者和所述增益之間的關(guān)聯(lián)時(shí),使用所述音頻系統(tǒng)來(lái)修正自動(dòng)增益控制(AGC)算法以增加攻擊或衰減率中的至少一個(gè),并且將所修正的AGC算法應(yīng)用到所述音頻信號(hào)來(lái)確定用于所述第一講話者的增益。所述方法還包括使用所述音頻系統(tǒng)將用于所述第一講話者的增益應(yīng)用到所述音頻信號(hào)的表示以產(chǎn)生輸出音頻信號(hào),并且從所述音頻系統(tǒng)輸出所述輸出音頻信號(hào)。
在另一個(gè)示例中,一種音頻系統(tǒng)包括用于使用音頻系統(tǒng)來(lái)處理音頻信號(hào)以識(shí)別第一講話者的裝置。所述音頻系統(tǒng)還包括講話者識(shí)別模塊,其確定所述音頻系統(tǒng)是否存儲(chǔ)了所述第一講話者和增益之間的關(guān)聯(lián)。所述音頻系統(tǒng)還包括自動(dòng)增益控制(AGC)模塊,其中當(dāng)所述音頻系統(tǒng)沒有存儲(chǔ)所述第一講話者和所述增益之間的關(guān)聯(lián)時(shí),所述講話者識(shí)別模塊修正所述AGC模塊以增加攻擊或衰減率中的至少一個(gè),其中所述AGC模塊將所修正的AGC算法應(yīng)用到所述音頻信號(hào)來(lái)確定用于所述第一講話者的增益,其中所述AGC模塊將用于所述第一講話者的增益應(yīng)用到所述音頻信號(hào)的表示以產(chǎn)生輸出音頻信號(hào),并且其中所述音頻系統(tǒng)輸出所述輸出音頻信號(hào)。
在另一個(gè)示例中,一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)包括指令,所述指令當(dāng)被執(zhí)行時(shí),執(zhí)行操作,包括:使用音頻系統(tǒng)來(lái)處理音頻信號(hào)以識(shí)別第一講話者,確定所述音頻系統(tǒng)是否存儲(chǔ)了所述第一講話者和增益之間的關(guān)聯(lián),并且當(dāng)所述音頻系統(tǒng)沒有存儲(chǔ)所述第一講話者和所述增益之間的關(guān)聯(lián)時(shí),使用所述音頻系統(tǒng)來(lái)修正自動(dòng)增益控制(AGC)算法以增加攻擊或衰減率中的至少一個(gè),并且將所修正的AGC算法應(yīng)用到所述音頻信號(hào)來(lái)確定用于所述第一講話者的增益。所述指令,當(dāng)被運(yùn)行時(shí),進(jìn)一步執(zhí)行操作包括:使用所述音頻系統(tǒng)將用于所述第一講話者的增益應(yīng)用到所述音頻信號(hào)的表示,以產(chǎn)生輸出音頻信號(hào),并且從所述音頻系統(tǒng)輸出所述輸出音頻信號(hào)。
一個(gè)或多個(gè)實(shí)施例的細(xì)節(jié)在以下的附圖和描述中被闡述。其他特征、目的以及優(yōu)點(diǎn)將根據(jù)描述和附圖,以及根據(jù)權(quán)利要求而顯而易見。
附圖說(shuō)明
圖1是說(shuō)明了音頻系統(tǒng)的框圖,該音頻系統(tǒng)通過使用在本公開中描述的聲紋匹配和快速攻擊增益控制技術(shù)來(lái)調(diào)整應(yīng)用到電信號(hào)的增益。
圖2是進(jìn)一步詳細(xì)說(shuō)明了圖1的音頻系統(tǒng)的示例實(shí)例的框圖。
圖3是說(shuō)明了根據(jù)在此描述的技術(shù)的音頻系統(tǒng)的示例操作的流程圖,該音頻系統(tǒng)響應(yīng)于由所述音頻系統(tǒng)所接收的音頻流中的新的講話者的引入而迅速調(diào)整增益。
圖4是說(shuō)明了根據(jù)所描述的技術(shù)的音頻系統(tǒng)的操作的示例模式的流程圖,該音頻系統(tǒng)響應(yīng)于由所述音頻系統(tǒng)所接收的音頻流中的新的講話者的引入而應(yīng)用組合增益。
具體實(shí)施方式
當(dāng)多講話者環(huán)境中的會(huì)話從柔和講話者(諸如離共享的麥克風(fēng)更遠(yuǎn)的講話者)轉(zhuǎn)換到高聲講話者(諸如離共享的麥克風(fēng)更近的講話者)(或者反之亦然)時(shí),在大約幾秒內(nèi)修正輸出增益的時(shí)間平均的自動(dòng)增益控制(AGC)算法可能無(wú)法用足夠的速度進(jìn)行調(diào)整以提供一致的音量。結(jié)果,在所述AGC算法的操作期間,高聲講話者可能被不充分地減弱和/或所述柔和講話者被不充分地放大。
總的來(lái)說(shuō),描述了用于為多講話者音頻調(diào)整音頻增益水平的技術(shù)。在一個(gè)示例中,在多講話者環(huán)境中進(jìn)行操作的音頻系統(tǒng)針對(duì)新的講話者的出現(xiàn)而連續(xù)監(jiān)測(cè)音頻流。在識(shí)別新的講話者時(shí),所述音頻系統(tǒng)確定所述新的講話者是否是首次講話者,該首次講話者的聲紋對(duì)系統(tǒng)來(lái)說(shuō)是不熟悉的。在所述新的講話者是首次講話者的情況下,所述音頻系統(tǒng)不具有與用于講話者的先前確定的音頻增益水平相關(guān)聯(lián)的聲紋的記錄。對(duì)于首次講話者,所述音頻系統(tǒng)執(zhí)行快速攻擊/衰減AGC算法,如以下進(jìn)一步詳細(xì)描述的,以便快速地確定用于所述首次講話者的增益值并且將所述增益值應(yīng)用到音頻輸出。當(dāng)所述首次講話者持續(xù)說(shuō)話時(shí),所述音頻系統(tǒng)附加地執(zhí)行標(biāo)準(zhǔn)AGC技術(shù)來(lái)改善用于所述首次講話者的增益。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于谷歌公司,未經(jīng)谷歌公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210586362.4/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 自動(dòng)增益控制裝置
- 自動(dòng)增益控制設(shè)備及方法
- 快速調(diào)整自動(dòng)增益控制值的方法及其模塊
- 一種數(shù)字自動(dòng)增益的控制方法及裝置
- 無(wú)線通信終端以及自動(dòng)增益控制方法
- 無(wú)線通信終端以及自動(dòng)增益控制方法
- 適合多時(shí)隙短突發(fā)結(jié)構(gòu)的兩級(jí)全數(shù)字自動(dòng)增益控制裝置
- 自動(dòng)增益控制電路及其控制方法
- 一種時(shí)分復(fù)用模式下的自動(dòng)增益控制方法和裝置
- 一種時(shí)分復(fù)用模式下的自動(dòng)增益控制裝置





