[發(fā)明專利]基于量化SNR分析和自適應(yīng)維納濾波的音頻信號質(zhì)量增強有效
| 申請?zhí)枺?/td> | 201710352587.6 | 申請日: | 2017-05-18 |
| 公開(公告)號: | CN108630221B | 公開(公告)日: | 2023-06-13 |
| 發(fā)明(設(shè)計)人: | M·阿里;X·周 | 申請(專利權(quán))人: | 現(xiàn)代自動車株式會社;起亞自動車株式會社 |
| 主分類號: | G10L21/0232 | 分類號: | G10L21/0232;G10L21/0264;G10L25/21;G10L25/60;G10L25/84 |
| 代理公司: | 北京尚誠知識產(chǎn)權(quán)代理有限公司 11322 | 代理人: | 龍淳 |
| 地址: | 韓國*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 量化 snr 分析 自適應(yīng) 濾波 音頻 信號 質(zhì)量 增強 | ||
本發(fā)明提供了一種音頻信號增強方法,包括:獲取音頻信號;評估音頻信號的音頻幀的信噪比(SNR);確定針對音頻幀的SNR閾值;根據(jù)SNR閾值與音頻幀的評估SNR的比較來選擇音頻信號處理技術(shù);使用應(yīng)用所選擇的信號處理技術(shù)的維納濾波器對音頻幀進行濾波;以及使用應(yīng)用所選擇的信號處理技術(shù)的維納濾波器輸出經(jīng)濾波的音頻幀。當音頻幀的評估SNR小于SNR閾值時,選擇先進先出(FIFO)信號處理技術(shù),并且當音頻幀的評估SNR大于SNR閾值時,選擇對數(shù)能量聲音活動檢測(VAD)信號處理技術(shù)。
技術(shù)領(lǐng)域
本發(fā)明通常涉及音頻信號質(zhì)量增強技術(shù),更具體地,涉及基于量化信噪比(SNR)分析和自適應(yīng)維納濾波的音頻信號質(zhì)量增強。
背景技術(shù)
支持聲音識別的應(yīng)用在現(xiàn)代車輛中越來越普遍。這種技術(shù)允許車輛的駕駛員通過簡單地發(fā)出一系列聲音命令來實現(xiàn)通常需要使用手的車載功能,例如進行電話呼叫或選擇要播放的音樂。這樣,駕駛員的手可以停留在方向盤上,駕駛員的目光可以保持在前方的道路上,從而降低事故風(fēng)險。
車輛中的“免提”通信通常使用藍牙來實施,藍牙是在2.4至2.485GHz的工業(yè)科學(xué)和醫(yī)學(xué)(ISM)頻段中操作的短距離無線通信。藍牙設(shè)計為用于低功耗,并使用每個兼容設(shè)備中配備的低成本收發(fā)器微芯片替代標準的基于線路的通信。除此之外,藍牙允許駕駛員將他們的手機與車輛的音頻系統(tǒng)配對,并利用車輛的音頻系統(tǒng)建立免提通話。
聲音識別或語音識別應(yīng)用程序可以利用藍牙獲取語音信號,識別信號內(nèi)的語言,并將口語翻譯成文本或允許計算機對識別的命令做出動作的一些其他形式。存在用于實現(xiàn)聲音識別的各種模型和技術(shù),例如自回歸(AR)模型、隱馬爾可夫模型、動態(tài)時間扭曲和神經(jīng)網(wǎng)絡(luò)等。每個聲音識別模型有各種優(yōu)點,包括更高的計算效率、增加的精確度、改進的速度等等。
所有聲音識別方法的共同之處在于從用戶獲取語音信號的過程。然而,當在含噪環(huán)境中嘗試聲音識別時,由于環(huán)境噪聲使來自用戶的語音信號變得混亂,所以性能經(jīng)常受到影響。當在車輛中實現(xiàn)聲音識別時,由于車輛內(nèi)部的車輛動力(例如,發(fā)動機、無線電、轉(zhuǎn)向信號指示器、車窗/天窗調(diào)整、加熱、通風(fēng)和空調(diào)(HVAC)風(fēng)扇等)以及車輛外部(例如,風(fēng)、雨、經(jīng)過的車輛、例如坑洼的路面特征、減速帶等)而存在若干噪聲源,所以出現(xiàn)這樣的問題。結(jié)果,車輛的艙室通常具有不同噪聲的混合,每種噪聲具有不同的特性(例如,位置、方向、音高、音量、持續(xù)時間等)。結(jié)果是基于藍牙的免提語音對話中的音頻質(zhì)量下降,聲音識別精確度差。
發(fā)明內(nèi)容
本發(fā)明提供了增強音頻信號質(zhì)量的技術(shù),更具體地,提供用于藍牙上進行的聲音通信的降噪。與維納濾波相結(jié)合地采用兩種不同的噪聲評估技術(shù),對數(shù)能量聲音活動檢測(VAD)和先進先出(FIFO)。兩種噪聲評估技術(shù)在不同含噪條件下都具有優(yōu)勢。特別地,已經(jīng)觀察到,基于這些技術(shù)的性能,對數(shù)能量VAD在更高信噪比(SNR)下比FIFO更有效,而FIFO在更低SNR下比對數(shù)能量VAD更有效。因此,本發(fā)明描述一種優(yōu)化的自適應(yīng)降噪方法,其將對數(shù)能量VAD和FIFO技術(shù)與維納濾波相組合。結(jié)果是,出現(xiàn)改進傳統(tǒng)維納濾波的新的信號濾波算法。
根據(jù)本發(fā)明的實施例,音頻信號增強方法包括:獲取音頻信號;評估音頻信號的音頻幀的信噪比(SNR);確定針對音頻幀的SNR閾值;根據(jù)SNR閾值與音頻幀的評估SNR的比較來選擇音頻信號處理技術(shù);使用應(yīng)用所選擇的信號處理技術(shù)的維納濾波器來對音頻幀進行濾波;以及輸出使用應(yīng)用所選擇的信號處理技術(shù)的維納濾波器濾波的音頻幀。當音頻幀的評估SNR小于SNR閾值時,選擇先進先出(FIFO)信號處理技術(shù),并且當音頻幀的評估SNR大于SNR閾值時,選擇對數(shù)能量聲音活動檢測(VAD)信號處理技術(shù)。
FIFO信號處理技術(shù)和對數(shù)能量VAD信號處理技術(shù)的相關(guān)性系數(shù)可以測量干凈信號與FIFO信號處理技術(shù)和對數(shù)能量VAD信號處理技術(shù)的相應(yīng)輸出信號之間的相關(guān)性。在這方面,音頻信號增強方法還可包括:分別計算FIFO信號處理技術(shù)和對數(shù)能量VAD信號處理技術(shù)的相關(guān)性系數(shù)。而且,SNR閾值為FIFO信號處理技術(shù)和對數(shù)能量VAD信號處理技術(shù)的相關(guān)性系數(shù)分別相同時的SNR值。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于現(xiàn)代自動車株式會社;起亞自動車株式會社,未經(jīng)現(xiàn)代自動車株式會社;起亞自動車株式會社許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710352587.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 多信道通信系統(tǒng)中數(shù)據(jù)傳輸?shù)膫鬏斈J竭x擇
- TD-SCDMA系統(tǒng)HSDPA混合自動重傳的軟比特合并方法
- 以余量共享方式進行的速率選擇
- 基于802.11網(wǎng)絡(luò)的快速切換方法
- 在存在背景噪聲的情況下的語音活動檢測
- 在子載波間重新分配功率的方法、無線發(fā)射器和存儲介質(zhì)
- 通過網(wǎng)絡(luò)中的裝置估計噪聲信道中的信噪比的方法和電力線通信裝置
- 基于量化SNR分析和自適應(yīng)維納濾波的音頻信號質(zhì)量增強
- 成像設(shè)備的動態(tài)范圍的評估
- 一種物聯(lián)網(wǎng)系統(tǒng)中選擇傳輸數(shù)據(jù)塊大小的方法





