[發明專利]音量校平器控制器和控制方法以及音頻分類器有效
| 申請號: | 201310100422.1 | 申請日: | 2013-03-26 |
| 公開(公告)號: | CN104080024B | 公開(公告)日: | 2019-02-19 |
| 發明(設計)人: | 王珺;蘆烈;阿蘭·西費爾特 | 申請(專利權)人: | 杜比實驗室特許公司 |
| 主分類號: | H04R1/20 | 分類號: | H04R1/20;H04S7/00 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 李春暉;李德山 |
| 地址: | 美國加利*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 音量 校平器 控制器 控制 方法 | ||
1.一種音量校平器控制方法,包括:
實時地識別音頻信號的內容類型;以及
通過隨著所述音頻信號的信息性內容類型的置信度值的增大或減小而分別增大或減小所述音量校平器的動態增益,并且隨著所述音頻信號的干擾性內容類型的置信度值的減小或增大而分別增大或減小所述音量校平器的動態增益,來基于所識別的內容類型以連續的方式調整音量校平器;
其中,將所述音頻信號分類到具有相應置信度值的多個內容類型中,并且所述調整的操作被配置成通過基于所述多個內容類型的重要性對所述多個內容類型的置信度值進行加權來考慮所述多個內容類型中的至少一些內容類型。
2.根據權利要求1所述的音量校平器控制方法,其中,所述音頻信號的所述內容類型包括語音、短期音樂、噪聲和背景聲音中的一個。
3.根據權利要求1所述的音量校平器控制方法,其中,噪聲被視為干擾性內容類型。
4.根據權利要求1所述的音量校平器控制方法,其中,所述調整的操作被配置成基于所述內容類型的置信度值來調整所述音量校平器的動態增益。
5.根據權利要求4所述的音量校平器控制方法,其中,所述調整的操作被配置成通過所述內容類型的置信度值的傳遞函數來調整所述動態增益。
6.根據權利要求1所述的音量校平器控制方法,其中,所述調整的操作被配置成基于所述置信度值來考慮至少一個主導的內容類型。
7.根據權利要求1所述的音量校平器控制方法,其中,將所述音頻信號分類到具有相應置信度值的多個干擾性內容類型中和/或具有相應置信度值的多個信息性內容類型中,并且所述調整的操作被配置成基于所述置信度值來考慮至少一個主導的干擾性內容類型和/或至少一個主導的信息性內容類型。
8.根據權利要求1至7中任一項所述的音量校平器控制方法,還包括,針對每個內容類型,基于所述音頻信號的過去的置信度值來對所述音頻信號的當次置信度值進行平滑。
9.根據權利要求8所述的音量校平器控制方法,其中,類型平滑操作被配置成通過計算當前的實際置信度值與上一次的經平滑的置信度值的加權和來確定所述音頻信號當次的經平滑的置信度值。
10.根據權利要求2至7中任一項所述的音量校平器控制方法,還包括識別所述音頻信號的上下文類型,其中,所述調整的操作被配置成基于所述上下文類型的置信度值來調整所述動態增益的范圍。
11.根據權利要求2至7中任一項所述的音量校平器控制方法,還包括識別所述音頻信號的上下文類型,其中,所述調整的操作被配置成基于所述音頻信號的所述上下文類型來將所述音頻信號的所述內容類型視為信息性的或者是干擾性的。
12.根據權利要求11所述的音量校平器控制方法,其中,所述音頻信號的所述上下文類型包括VoIP、電影類媒體、長期音樂和游戲中的一個。
13.根據權利要求11所述的音量校平器控制方法,其中,在VoIP上下文類型的音頻信號中,背景聲音被視為干擾性內容類型;而在非VoIP上下文類型的音頻信號中,所述背景聲音和/或語音和/或音樂被視為信息性內容類型。
14.根據權利要求11所述的音量校平器控制方法,其中,取決于音頻信號的上下文類型,給不同上下文類型的音頻信號中的所述內容類型分配不同的權重。
15.根據權利要求11所述的音量校平器控制方法,其中,將所述音頻信號分類到具有相應置信度值的多個上下文類型中,并且所述調整的操作被配置成通過基于所述置信度值對所述多個上下文類型的影響進行加權來考慮所述多個上下文類型中的至少一些上下文類型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杜比實驗室特許公司,未經杜比實驗室特許公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310100422.1/1.html,轉載請聲明來源鉆瓜專利網。





