[發明專利]一種復雜環境下語音特征映射方法有效
| 申請號: | 201710151497.0 | 申請日: | 2017-03-14 |
| 公開(公告)號: | CN106782520B | 公開(公告)日: | 2019-11-26 |
| 發明(設計)人: | 王志鋒;郭天學;左明章;田元;姚璜 | 申請(專利權)人: | 華中師范大學 |
| 主分類號: | G10L15/20 | 分類號: | G10L15/20;G10L15/02;G10L15/14;G10L17/02;G10L17/06 |
| 代理公司: | 42222 武漢科皓知識產權代理事務所(特殊普通合伙) | 代理人: | 魏波<國際申請>=<國際公布>=<進入國 |
| 地址: | 430079 湖*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 復雜 環境 語音 特征 映射 方法 | ||
本發明提供了一種復雜環境下語音特征映射方法,首先提取干凈環境下的語音信號的特征;然后提取復雜環境下的語音信號的特征;接著利用特征映射方法對復雜環境下的語音信號進行特征映射,使得到的映射特征可近似視為干凈環境下的語音信號特征;最后與已經訓練完畢的干凈環境下的語音信號模型進行模式匹配和識別。本發明利用特征映射函數對復雜環境下的語音信號進行映射,使得到的特征可以近似視為干凈環境下的語音信號特征,通過映射函數的作用可使復雜環境下的語音特征的純凈度得到大幅度提升從而提升語音識別的準確度,提高語音識別系統的魯棒性。
技術領域
本發明屬于語音信號處理技術領域,特別涉及一種復雜環境下語音特征映射方法。
技術背景
隨著計算機技術的深入發展,模式識別已經成為一種為人類帶來巨大便利的實用技術,特別是在人機交互領域。模式識別能夠為人機交互提供新的方式,為用戶帶來更加自然和更有沉浸感的交互體驗。而語音識別是模式識別中非常重要的一個模塊,在人類自然的交互中,語音交流是最為重要的一種方式,語音識別的運用使得人能夠以自然的交互方式與機器進行交互,這種交互方式的便利性可大大緩解人類在人機交互中的壓力,豐富了人與機器交互的方式,也使得人機交互更加的豐富和多樣。近幾十年語音識別已經發展的足夠完美,識別率也足夠高,然而這些結果都是在實驗室內得出的結果,也就是說,在干凈環境下,語音識別的結果是足夠好的。但是在現實生活中,環境的復雜度是無法估量的,人們幾乎不可能保證所身處的環境都是干凈的環境,人們的周邊充斥著噪音,這些噪音可能是周圍自然環境所發出的噪聲,也可能是其他人所發出的噪聲,也可能是錄音設備的噪聲。也就是說,語音識別在自然的應用中是處于被噪聲包圍的復雜環境下的,而語音識別亟需解決的痛點就是在復雜環境下的識別率并不高,甚至是其結果是不被人們所接受的。
語音識別的結果受到周圍環境的影響,在實驗室環境(即干凈環境下)其結果足夠好,但是在現實環境(即復雜環境)中其結果是不被人們所接受的。這是亟需解決的問題。語音識別的過程包括模型訓練和識別兩個過程,而模型訓練一般使用的都是干凈環境下的語音信號,識別過程使用的是復雜環境下即真實的語音信號。要解決這個問題就需要從如何使復雜環境下的語音信號與干凈環境下的語音信號進行匹配入手。在語音信號的處理過程中,有兩個非常重要的環節,特征提取和建立模型,當今的解決方案大致便可以分為兩種,一種是從特征入手,另一種是從模型入手。
特征映射就是從特征入手的一種解決方案。通過特征映射函數的作用,將復雜環境下的語音信號特征轉換成可以近似視為干凈環境下的語音信號特征。可大大提高現實應用中語音識別的準確率,提高語音識別系統的魯棒性。
發明內容
本發明的目的在于提出一種通過特征映射來提高復雜環境下語音識別系統的魯棒性的方法,該方法通過對復雜環境下的語音特征進行映射,使得復雜環境下的語音特征通過映射函數映射得到的語音特征具有近似干凈環境下語音特征的純凈度,從而來提高語音識別系統在復雜環境下的識別率。
本發明所采用的技術方案是:一種復雜環境下語音特征映射方法,其特征在于,包括以下步驟:
步驟1:提取干凈環境下的語音信號的特征;
步驟2:對復雜環境下的語音進行特征提取;
步驟3:利用特征映射方法對復雜環境下的語音特征進行映射;
步驟4:模式匹配與識別。
本發明具有以下優點和有益效果:
(1)本發明中提出的特征映射方法是一種線性的映射方法,計算簡便且計算值為精確值,能夠提高參數的精度;
(2)本發明提出的映射方法通過對復雜環境下的語音特征進行映射,能提高語音識別系統的識別準確率,具有較強的魯棒性;
(3)本發明提出的映射方法還可以對干凈環境下的語音進行映射,依然可以取得同樣的效果;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華中師范大學,未經華中師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710151497.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:基于置信度的語音識別實現方法及系統
- 下一篇:一種語音識別系統





