[發(fā)明專利]基于量化SNR分析和自適應(yīng)維納濾波的音頻信號質(zhì)量增強有效

申請?zhí)枺?/td>	201710352587.6	申請日：	2017-05-18
公開（公告）號：	CN108630221B	公開（公告）日：	2023-06-13
發(fā)明（設(shè)計）人：	M·阿里;X·周	申請（專利權(quán)）人：	現(xiàn)代自動車株式會社;起亞自動車株式會社
主分類號：	G10L21/0232	分類號：	G10L21/0232;G10L21/0264;G10L25/21;G10L25/60;G10L25/84
代理公司：	北京尚誠知識產(chǎn)權(quán)代理有限公司 11322	代理人：	龍淳
地址：	韓國***	國省代碼：	暫無信息
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	基于量化 snr 分析自適應(yīng) 濾波音頻信號質(zhì)量增強
鉆瓜網(wǎng) 技術(shù)展會專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【說明書】：

本發(fā)明提供了一種音頻信號增強方法，包括：獲取音頻信號；評估音頻信號的音頻幀的信噪比(SNR)；確定針對音頻幀的SNR閾值；根據(jù)SNR閾值與音頻幀的評估SNR的比較來選擇音頻信號處理技術(shù)；使用應(yīng)用所選擇的信號處理技術(shù)的維納濾波器對音頻幀進行濾波；以及使用應(yīng)用所選擇的信號處理技術(shù)的維納濾波器輸出經(jīng)濾波的音頻幀。當音頻幀的評估SNR小于SNR閾值時，選擇先進先出(FIFO)信號處理技術(shù)，并且當音頻幀的評估SNR大于SNR閾值時，選擇對數(shù)能量聲音活動檢測(VAD)信號處理技術(shù)。

技術(shù)領(lǐng)域

本發(fā)明通常涉及音頻信號質(zhì)量增強技術(shù)，更具體地，涉及基于量化信噪比(SNR)分析和自適應(yīng)維納濾波的音頻信號質(zhì)量增強。

背景技術(shù)

支持聲音識別的應(yīng)用在現(xiàn)代車輛中越來越普遍。這種技術(shù)允許車輛的駕駛員通過簡單地發(fā)出一系列聲音命令來實現(xiàn)通常需要使用手的車載功能，例如進行電話呼叫或選擇要播放的音樂。這樣，駕駛員的手可以停留在方向盤上，駕駛員的目光可以保持在前方的道路上，從而降低事故風(fēng)險。

車輛中的“免提”通信通常使用藍牙來實施，藍牙是在2.4至2.485GHz的工業(yè)科學(xué)和醫(yī)學(xué)(ISM)頻段中操作的短距離無線通信。藍牙設(shè)計為用于低功耗，并使用每個兼容設(shè)備中配備的低成本收發(fā)器微芯片替代標準的基于線路的通信。除此之外，藍牙允許駕駛員將他們的手機與車輛的音頻系統(tǒng)配對，并利用車輛的音頻系統(tǒng)建立免提通話。

聲音識別或語音識別應(yīng)用程序可以利用藍牙獲取語音信號，識別信號內(nèi)的語言，并將口語翻譯成文本或允許計算機對識別的命令做出動作的一些其他形式。存在用于實現(xiàn)聲音識別的各種模型和技術(shù)，例如自回歸(AR)模型、隱馬爾可夫模型、動態(tài)時間扭曲和神經(jīng)網(wǎng)絡(luò)等。每個聲音識別模型有各種優(yōu)點，包括更高的計算效率、增加的精確度、改進的速度等等。

所有聲音識別方法的共同之處在于從用戶獲取語音信號的過程。然而，當在含噪環(huán)境中嘗試聲音識別時，由于環(huán)境噪聲使來自用戶的語音信號變得混亂，所以性能經(jīng)常受到影響。當在車輛中實現(xiàn)聲音識別時，由于車輛內(nèi)部的車輛動力(例如，發(fā)動機、無線電、轉(zhuǎn)向信號指示器、車窗/天窗調(diào)整、加熱、通風(fēng)和空調(diào)(HVAC)風(fēng)扇等)以及車輛外部(例如，風(fēng)、雨、經(jīng)過的車輛、例如坑洼的路面特征、減速帶等)而存在若干噪聲源，所以出現(xiàn)這樣的問題。結(jié)果，車輛的艙室通常具有不同噪聲的混合，每種噪聲具有不同的特性(例如，位置、方向、音高、音量、持續(xù)時間等)。結(jié)果是基于藍牙的免提語音對話中的音頻質(zhì)量下降，聲音識別精確度差。

發(fā)明內(nèi)容

本發(fā)明提供了增強音頻信號質(zhì)量的技術(shù)，更具體地，提供用于藍牙上進行的聲音通信的降噪。與維納濾波相結(jié)合地采用兩種不同的噪聲評估技術(shù)，對數(shù)能量聲音活動檢測(VAD)和先進先出(FIFO)。兩種噪聲評估技術(shù)在不同含噪條件下都具有優(yōu)勢。特別地，已經(jīng)觀察到，基于這些技術(shù)的性能，對數(shù)能量VAD在更高信噪比(SNR)下比FIFO更有效，而FIFO在更低SNR下比對數(shù)能量VAD更有效。因此，本發(fā)明描述一種優(yōu)化的自適應(yīng)降噪方法，其將對數(shù)能量VAD和FIFO技術(shù)與維納濾波相組合。結(jié)果是，出現(xiàn)改進傳統(tǒng)維納濾波的新的信號濾波算法。

根據(jù)本發(fā)明的實施例，音頻信號增強方法包括：獲取音頻信號；評估音頻信號的音頻幀的信噪比(SNR)；確定針對音頻幀的SNR閾值；根據(jù)SNR閾值與音頻幀的評估SNR的比較來選擇音頻信號處理技術(shù)；使用應(yīng)用所選擇的信號處理技術(shù)的維納濾波器來對音頻幀進行濾波；以及輸出使用應(yīng)用所選擇的信號處理技術(shù)的維納濾波器濾波的音頻幀。當音頻幀的評估SNR小于SNR閾值時，選擇先進先出(FIFO)信號處理技術(shù)，并且當音頻幀的評估SNR大于SNR閾值時，選擇對數(shù)能量聲音活動檢測(VAD)信號處理技術(shù)。

FIFO信號處理技術(shù)和對數(shù)能量VAD信號處理技術(shù)的相關(guān)性系數(shù)可以測量干凈信號與FIFO信號處理技術(shù)和對數(shù)能量VAD信號處理技術(shù)的相應(yīng)輸出信號之間的相關(guān)性。在這方面，音頻信號增強方法還可包括：分別計算FIFO信號處理技術(shù)和對數(shù)能量VAD信號處理技術(shù)的相關(guān)性系數(shù)。而且，SNR閾值為FIFO信號處理技術(shù)和對數(shù)能量VAD信號處理技術(shù)的相關(guān)性系數(shù)分別相同時的SNR值。

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于現(xiàn)代自動車株式會社;起亞自動車株式會社，未經(jīng)現(xiàn)代自動車株式會社;起亞自動車株式會社許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201710352587.6/2.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

上一篇：回聲抑制音頻信號特征跟蹤的處理系統(tǒng)、方法及裝置
下一篇：信號處理系統(tǒng)以及信號處理方法

同類專利

專利分類

G 物理

G10 樂器；聲學(xué)
G10L 語音分析或合成；語音識別；音頻分析或處理
G10L21-00 為了改變語音信號的質(zhì)量或其可識度而處理語音信號，以產(chǎn)生另一種可聽的或非可聽的信號，例如視覺信號或觸覺信號
G10L21-02 .語音增強，例如降低噪聲或消除回聲
G10L21-04 .時間壓縮或擴展
G10L21-06 .將語音轉(zhuǎn)換成非可聽表達形式，例如語音可視化、觸覺輔助的語音處理

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實用新型專利、外觀設(shè)計專利（升級中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】