[發明專利]一種基于深度學習的階梯式語音增強方法有效
| 申請號: | 202011359400.3 | 申請日: | 2020-11-27 |
| 公開(公告)號: | CN112562710B | 公開(公告)日: | 2022-09-30 |
| 發明(設計)人: | 胡靜;萬里;王建榮;劉李 | 申請(專利權)人: | 天津大學 |
| 主分類號: | G10L21/0208 | 分類號: | G10L21/0208 |
| 代理公司: | 天津盛理知識產權代理有限公司 12209 | 代理人: | 霍慧慧 |
| 地址: | 300071*** | 國省代碼: | 天津;12 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 深度 學習 階梯 語音 增強 方法 | ||
本發明涉及一種基于深度學習的階梯式語音增強方法,其特征在于:所述方法的步驟為:a)一階合適機器感知框架的建立;b)二階適合人耳聽覺感知框架建立。本發明設計科學合理,說提出的基于階梯式方法的有效性,既能得到適合機器感知的語音,又能得到適合人耳感知的語音。
技術領域
本發明屬于語音信號處理領域,涉及信號處理技術,特別涉及一種基于深度學習的階梯式語音增強方法。
背景技術
語音是人類相互傳遞信息最基本也是最重要的方式,語言是人類特有的能力,聲音是語言傳遞信息最重要的工具。現今人機交互成為了未來發展的一個重要臺階,語音作為人機交互的門面現在的地位越發的重要,所以對于一個優秀的人機交互系統來說,優秀的語音前端發揮著不可替代的作用。在現實生活中,我們所處的環境時時刻刻都充斥著噪聲,因此更好的背景噪聲抑制方案,能更有利于人機交互,人人交互。
自動語音識別(Automatic Speech Recognition,ASR)\cite{hermus2006review}是利用信號處理和模式識別技術將語音信號轉換為文本信息。當今越來越多的產品使用到了語音識別技術,在一定程度上而言語音識別是未來人機交互最重要的基石。近十多年隨著科技的發展,特別是2009年以來,依托于計算機算力的深度學習和機器學習及大數據技術的飛速發展,奠定了語音識別落地化的基礎,并且已經在市場上取得了非凡的成果。各大互聯網公司爭先恐后的開發各種語音服務,尤其是手機移動端的語音識別已經深入我們的日常生活。
國內外對語音產品化落地高度重視,國外蘋果公司開發的Siri是蘋果公司內嵌在其各個設備上的語音助手。用戶自身可以利用Siri調用系統自身應用來查詢實時信息。再如Assistant(谷歌語音助手)、Cortana(微軟語音助手)以及Alexa(亞馬遜語音助手)都是目前國外系統比較完善的的語音系統。國內研究語音識別研究雖然不如國外早,但現如今國內語音市場也達到了空前的繁榮地步,主要產品載體就是現今應用廣泛的智能音箱,如天貓精靈、小度智能音響等。但現實場景的多變性使得語音識別在很多場景下不能有很好的作用,如當前我們使用的小艾音箱在較為嘈雜的場景中不能準確的做出相應的判斷,車載語音識別系統在車速較高的場景中不能很好的識別出的說話內容,再如在吵雜的場景中人工耳蝸不能很好的適應噪聲,使得聽障人事不能很好的根據聽覺判他人說話內容等。所以提高在復雜場景下的語音信號水平,能夠在很大程度上幫助提升語音識別準備率和人耳感知感知評判水平。
提升語音質量的關鍵技術就是增強目標信號的感知強度,即語音增強,其本質是抑制噪聲信號表達,從而增強目標語音內容。一方面語音增強能夠更好表達帶噪語音信號中的目標信號的感知強度從而提升帶噪信號的聽覺感知強度和增加其可懂度,另一方面能夠提升增強后語音在其他應用上的魯棒性。現今深度學習呼聲越來越高,相較于傳統的信號處理的方法,深度學習在信號領域帶來了非常大的增益。特別是相較于傳統的信號處理方法,深度學習對于非靜態噪聲的抑制表現出了很好的語音分離效果。
發明內容
本發明的目的在于克服現有技術的不足,提供一種基于深度學習的階梯式語音增強方法,通過該方法能夠得到不僅適合機器感知的增強語音信號,進一步在此基礎上能夠得到適合人耳聽覺感知的語音信號。
本發明解決其技術問題是通過以下技術方案實現的:
一種基于深度學習的階梯式語音增強方法,其特征在于:所述方法的步驟為:
a)一階合適機器感知框架的建立:
步驟S1、對語音信號進行分幀及加窗處理,再進行短時傅里葉變換,將時序信號變換頻域信號;
步驟S2、設計啟發式輸入方式,將輸入集中于低頻區域,增強低頻區的感知強度,具體表達如下公式所示:
Y=(Yi×signal(Yi,…,Yn),Yi,…,Yn)
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于天津大學,未經天津大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011359400.3/2.html,轉載請聲明來源鉆瓜專利網。





