[發明專利]基于單麥克風的人聲提取方法及裝置在審
| 申請號: | 201610098307.9 | 申請日: | 2016-02-23 |
| 公開(公告)號: | CN105719657A | 公開(公告)日: | 2016-06-29 |
| 發明(設計)人: | 肖觀送;黃錦昌 | 申請(專利權)人: | 惠州市德賽西威汽車電子股份有限公司 |
| 主分類號: | G10L21/0216 | 分類號: | G10L21/0216;G10K11/178 |
| 代理公司: | 廣州粵高專利商標代理有限公司 44102 | 代理人: | 陳衛;禹小明 |
| 地址: | 516006 廣東省*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 麥克風 人聲 提取 方法 裝置 | ||
技術領域
本發明涉及聲音處理領域,特別涉及一種基于單麥克風的人聲提取方法和裝置。
背景技術
目前,語音識別中一般的降噪方案是加入獨立的降噪模塊,這種降噪模塊一般采用雙麥克風的主動降噪技術,即副麥克風的噪聲信號相位經過反向再與主麥克風中的噪聲信號相加,從而對噪聲信號起到抑制的作用。但是該方案需要獨立的降噪模塊和兩個麥克風,成本較高。對雙麥克風的安裝也有一定的要求,增加了安裝的復雜性。以及在多人說話環境下難以區分出真正用戶,造成低識別率。模塊開發者在開發時需要開發復雜的算法保證兩個麥克風進入的聲音信號在進行處理時的時序一致。
發明內容
本發明的目的是為了克服上述背景技術的缺陷,提供一種基于單麥克風的人聲提取方法和裝置。
一種基于單麥克風的人聲提取方法,包括具有至少一個麥克風的人聲提取裝置,所述采集系統還包括用于處理所述麥克風獲取的聲音信號的音頻信號處理器以及語音識別內核,所述音頻信號處理器提取人聲具體步驟包括如下:
S10、對獲取的至少一路聲音信號做模數轉換,獲得原聲音信號;
S20、對聲音信號每個時頻點進行分析統計,根據預先的人聲預提取方法獲得的用戶聲音特征提取初步人聲信號;
S30、將所述初步人聲信號進行相位相反,并與所述原聲音信號相加,獲得噪聲信號;
S40、將所述噪聲信號進行相位相反,并與所述原聲音信號相加,獲得最終人聲信號;
所述人聲與提取方法為在低噪聲的環境中進行語音特征參數提取法。
進一步的,還包括:
S50、對最終人聲做信號增益處理;
S60、將增益處理后的最終人聲信號發送到語音識別內核。
其中,所述特征參數提取法包括如下步驟:
S201、對聲音信號進行抗混疊濾波;
S202、對步驟S201獲得的信號進行模數轉換;
S203、對步驟S202獲得的信號進行高通濾波;
S204、對步驟S203獲得的信號進行做分幀處理;
S205、采用哈明窗口對步驟S204獲得的每幀數據進行加窗處理;
S206、對步驟S205獲得的信號做頻域轉換;
S207、對步驟S206獲得的信號進行三角窗濾波;
S208、對步驟S207獲得的信號進行對數運算;
S209、對步驟S208獲得的信號做離散余弦變換;
S210、對步驟S209獲得的信號進行譜加權;
S211、對步驟S210獲得的信號做倒譜均值減處理;
S212、在步驟S211獲得的信號加入表征語音動態特性的差分參數,獲得用戶聲音特征。
優選的,所述人聲提取裝置采用一個麥克風。
另外,本發明還提供一種基于上述人聲提取方法的單麥克風人聲提取裝置包括一個麥克風,與所述麥克風連接的聲音信號處理器以及用于識別語音的語音識別內核,所述聲音信號處理器包括用于對獲取的聲音信號做模數轉換的模塊、用于對聲音信號每個時頻點進行分析統計的模塊、用于做預先的人聲預提取方法的模塊以及用于對聲音信號進行反向和/或相加的模塊。
優選的,所述聲音處理器還包括用于多聲音信號做增益處理的模塊。
本發明對人聲信號進行采樣量化,再與系統獲取到具有用戶聲音特征的聲學模型對比,提取出用戶聲音信號,并在過濾了噪聲信號的信號中再次提取出人聲信號。由于經過了一次噪聲抑制,提取出的人聲信號更加純凈,可以最大限度提取出用戶聲音,并且每個人聲音特征存在差異性,根據這個特征還可以過濾周圍人發出的聲音。
附圖說明
圖1為本發明的人聲提取方法的方法流程圖。
圖2為本發明的特征參數提取法的步驟流程圖。
圖3為本發明的單麥克風人聲提取裝置構架原理圖。
具體實施方式
下面將結合附圖對本發明的基于單麥克風的人聲提取方法和裝置作進一步的描述。
一種基于單麥克風的人聲提取方法,包括具有一個麥克風的人聲提取裝置,采集系統還包括用于處理麥克風獲取的聲音信號的音頻信號處理器以及語音識別內核,如圖1所示。音頻信號處理器提取人聲具體步驟包括如下:
S10、對獲取的單路聲音信號做模數轉換,將原始的模擬聲音信號轉換成數字信號,從而獲得待處理的原聲音信號;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于惠州市德賽西威汽車電子股份有限公司,未經惠州市德賽西威汽車電子股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610098307.9/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:基于聲紋識別的錄音文件分離方法及裝置
- 下一篇:聲音檢索裝置、聲音檢索方法





