[發明專利]一種自適應通話音量控制方法及裝置有效
| 申請號: | 201910030712.0 | 申請日: | 2019-01-14 |
| 公開(公告)號: | CN109994104B | 公開(公告)日: | 2021-05-14 |
| 發明(設計)人: | 謝宜昊 | 申請(專利權)人: | 珠海慧聯科技有限公司 |
| 主分類號: | G10L15/20 | 分類號: | G10L15/20;G10L21/0208;G10L21/0272;G10L25/18;G10L25/21;G10L25/45 |
| 代理公司: | 廣州嘉權專利商標事務所有限公司 44205 | 代理人: | 俞梁清 |
| 地址: | 519000 廣東省珠*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 自適應 通話 音量 控制 方法 裝置 | ||
1.一種自適應通話音量控制方法,其特征在于,包括以下步驟:
S100)分別采集遠端語音信號和近端語音信號,并通過濾波分別提取形成遠端子帶信號和近端子帶信號;
S200)基于遠端子帶信號和近端子帶信號,形成針對遠端語音信號和近端語音信號的語音均衡參數;
S300)根據語音均衡參數對遠端子帶信號作增益乘法,并解碼所獲得的輸出子帶信號;
S400)通過揚聲器播放解碼所述輸出子帶信號的輸出語音;
其中,所述遠端子帶信號和所述近端子帶信號分別是通過對遠端語音信號和近端語音信號這兩種語音信號交疊和快速傅里葉變換得到的;以及
其中,所述步驟S100包括以下子步驟:
S110)分別獲取遠端語音信號和近端語音信號在多個時刻的信號,以形成遠端語音信號向量和近端語音信號向量;
S120)相應合并時間上連續的R個遠端語音信號向量和近端語音信號向量為復合遠端語音信號向量和復合近端語音信號向量;
S130)對復合遠端語音信號向量和復合近端語音信號向量加窗處理,以獲得加窗遠端語音信號向量和加窗近端語音信號向量;
S140)分別對加窗遠端語音信號向量和加窗近端語音信號向量執行快速傅里葉變換以形成相應的遠端子帶信號和近端子帶信號。
2.根據權利要求1所述的方法,其特征在于,用于合并時間上連續遠端語音信號向量和近端語音信號向量以形成復合遠端語音信號向量和復合近端語音信號向量的個數R為2。
3.根據權利要求1或2所述的方法,其特征在于,所述語音均衡參數是基于遠端子帶信號的功率譜估計以及近端子帶信號的背景噪聲估計而確定的。
4.根據權利要求3所述的方法,其特征在于,所述步驟S200還包括以下子步驟:
S210)將遠端子帶信號和近端子帶信號的幅度平方分別通過遠端歷史向量和近端歷史向量進行平滑,并將平滑后的遠端子帶信號和近端子帶信號作為遠端子帶信號的遠端平滑功率譜,以及近端子帶信號的近端平滑功率譜;
S220)將所述遠端平滑功率譜和近端平滑功率譜分別映射為人耳感知域的遠端臨界頻帶功率譜及近端臨界頻帶功率譜;
S230)分別根據遠端平滑功率譜及近端平滑功率譜的頻域粗糙度,選取人耳聽覺域能量的遠端子帶信號輸入平滑系數和近端子帶信號輸入平滑系數;
S240)基于遠端子帶信號輸入平滑系數、近端子帶信號輸入平滑系數、遠端臨界頻帶功率譜及近端臨界頻帶功率譜,計算語音均衡參數。
5.根據權利要求4所述的方法,其特征在于,所述步驟S240還包括以下子步驟:
S241)由所述遠端子帶信號輸入平滑系數平滑遠端臨界頻帶功率譜,并選取平滑后的遠端臨界頻帶功率譜的能量與人耳絕對聽覺閾值的最大值作為遠端子帶信號輸入聽覺域能量;
S242)由所述近端子帶信號輸入平滑系數平滑近端臨界頻帶功率譜,并選取平滑后的近端臨界頻帶功率譜的能量與人耳絕對聽覺閾值的最大值作為近端子帶信號輸入聽覺域能量;
S243)將近端子帶信號輸入聽覺域能量與所述遠端子帶信號輸入聽覺域能量相減并插值,以作為語音均衡參數。
6.根據權利要求4或5所述的方法,其特征在于,所述步驟S300還包括以下子步驟:
S310)將所述遠端子帶信號和語音均衡參數作增益乘法,以獲得輸出子帶信號;
S320)對所述輸出子帶信號作反傅里葉變換以獲得全頻帶信號向量;
S330)對所述全頻帶信號向量進行所述加窗處理,以獲得加窗全頻帶信號向量;
S340)疊加所述加窗全頻帶信號向量,以獲得輸出語音。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于珠海慧聯科技有限公司,未經珠海慧聯科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910030712.0/1.html,轉載請聲明來源鉆瓜專利網。





