[發明專利]利用線性麥克風陣列的語音識別方法及系統有效
| 申請號: | 201611202169.0 | 申請日: | 2016-12-23 |
| 公開(公告)號: | CN106710603B | 公開(公告)日: | 2019-08-06 |
| 發明(設計)人: | 賀來朋 | 申請(專利權)人: | 云知聲(上海)智能科技有限公司 |
| 主分類號: | G10L21/0216 | 分類號: | G10L21/0216;G10L15/20 |
| 代理公司: | 上海唯源專利代理有限公司 31229 | 代理人: | 曾耀先 |
| 地址: | 200233 上海市徐*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 噪聲波束 麥克風陣列 語音識別 主波束 波束形成器 語音數據 聲音獲取 音頻數據 區域設置 區域形成 文本數據 計算量 準確率 濾除 錄制 輸出 | ||
本發明公開了一種利用線性麥克風陣列的語音識別方法,包括如下步驟:利用線性麥克風陣列錄制環境的聲音以形成音頻數據;針對線性麥克風陣列前方的聲音獲取區域設置波束形成器,利用波束形成器于聲音獲取區域形成位于中部的主波束區域和位于兩側部的第一噪聲波束區域和第二噪聲波束區域;將音頻數據輸入到波束形成器中以獲得對應主波束區域的主波束、對應第一噪聲波束區域的第一噪聲波束、以及對應第二噪聲波束區域的第二噪聲波束;從主波束中濾除第一噪聲波束和第二噪聲波束以得到待識別的語音數據;對待識別的語音數據進行語音識別以得到對應的文本數據并輸出。本發明計算量小,獲取的語音數據質量高,能夠提高語音識別的準確率。
技術領域
本發明涉及人機語音識別領域,尤指一種利用線性麥克風陣列的語音識別方法及系統。
背景技術
在語音識別系統中,通常要對麥克風獲取到的音頻信號進行降噪處理,從而抑制音頻信號中的環境噪聲成分,從而提高語音識別系統的識別準確率。根據系統中使用的麥克風個數的不同,采用的降噪算法大致可以分為單麥克風降噪、雙麥克風降噪以及麥克風陣列降噪算法等。
隨著硬件系統的快速發展,麥克風陣列正得到越來越廣泛的應用。根據陣元的拓撲結構不同,麥克風陣列通??梢苑譃榫€性陣列和環形陣列。無論是線性陣列還是環形陣列,在進行降噪處理時,一般都需要通過聲源定位算法獲取期望信號的空間方位,再通過固定波束成形算法形成一個具有特定形狀的接收波束,并將波束主瓣中心指向期望信號所在的方向。
然而,同時進行聲源定位和自適應波束成形的計算量很大,而且當聲源定位出現偏差時,很容易對期望信號造成抑制或引入失真,進而影響到語音識別系統性能。
發明內容
本發明的目的在于克服現有技術的缺陷,提出一種利用線性麥克風陣列的語音識別方法及系統,解決現有的麥克風陣列的設置方式存在計算量大,計算復雜和實現成本較高的問題,目的在于利用麥克風陣列達到很好的降噪效果,以獲得高質量的音頻數據并提高語音識別的準確率。
為了實現上述目的,本發明提供了一種利用線性麥克風陣列的語音識別方法,所述方法包括:
利用線性麥克風陣列錄制環境的聲音以形成音頻數據;針對所述線性麥克風陣列前方的聲音獲取區域設置波束形成器,利用所述波束形成器于所述聲音獲取區域形成位于中部的主波束區域和位于兩側部的第一噪聲波束區域和第二噪聲波束區域;將所述音頻數據輸入到所述波束形成器中以獲得對應所述主波束區域的主波束、對應所述第一噪聲波束區域的第一噪聲波束、以及對應所述第二噪聲波束區域的第二噪聲波束;從所述主波束中濾除所述第一噪聲波束和所述第二噪聲波束以得到待識別的語音數據;對所述待識別的語音數據進行語音識別以得到對應的文本數據并輸出。
本發明的有益效果為:本發明通過將聲音獲取區域內設計形成三個波束區域,其中的兩個波束用于獲取噪聲,另一個波束用于獲取期望信號,并通過波束形成器輸出對應的噪聲波束和主波束,而后通過自適應濾波器模塊從主波束中進一步濾除噪聲波束。該方法不需要實時跟蹤聲源方位,避免了傳統算法可能因為聲源位置估計偏差帶來的對期望信號的抑制或失真;同時算法計算量小,實現過程簡單方便,成本較低,獲取的語音數據質量高,能夠提高語音識別的準確率。另外結合了語音數據對語音識別器的自適應,能夠進一步提高語音識別的準確率。
本發明的進一步改進為:針對所述線性麥克風陣列前方的聲音獲取區域設置波束形成器,包括:所述聲音獲取區域包括角度0°至180°的平面區域;設置用于形成所述第一噪聲波區域的第一波束形成器,將所述第一波束形成器所形成的波束的中心指向所述聲音獲取區域的20°方向;設置用于形成所述主波束區域的第二波束形成器,將所述第二波束形成器所形成的波束的中心指向所述聲音獲取區域的90°方向;設置用于形成所述第二噪聲波束區域的第三波束形成器,將所述第三波束形成器所形成的波束的中心指向所述聲音獲取區域的160°方向。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于云知聲(上海)智能科技有限公司,未經云知聲(上海)智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611202169.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:文件處理方法及裝置
- 下一篇:一種低成本高容量全固態鋰離子電池的制備方法





