[發明專利]語音識別方法及系統有效
| 申請號: | 201710317318.6 | 申請日: | 2017-05-04 |
| 公開(公告)號: | CN108806691B | 公開(公告)日: | 2020-10-16 |
| 發明(設計)人: | 任寶剛 | 申請(專利權)人: | 有愛科技(深圳)有限公司 |
| 主分類號: | G10L15/26 | 分類號: | G10L15/26;G10L15/02 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 518000 廣東省深圳市南山*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 識別 方法 系統 | ||
1.一種語音識別方法,其特征在于,
識別前,包括以下步驟:
S01、預先接收用戶輸入的語音信號和用戶定義的與該輸入的語音信號相對應的期望識別結果;
S02、從輸入的語音信號中提取出可表征該語音信號的聲學特征;
S03、將用戶輸入的語音信號和/或提取出的聲學特征與所述期望識別結果建立映射關系,以建立或更新特定人聲學數據庫;
識別時,其包括以下步驟:
S1、接收用戶輸入的待識別語音信號,并從輸入的待識別語音信號中提取出可表征該待識別語音信號的聲學特征;
S2、獲取特定人聲學數據庫,將提取的待識別語音信號的聲學特征與特定人聲學數據庫進行模式匹配,尋找最佳匹配于該待識別語音信號的識別結果;若該最佳匹配的識別結果滿足預設條件,則將該最佳匹配的識別結果作為該待識別語音信號的最終識別結果進行輸出;若無最佳匹配的識別結果或該最佳匹配的識別結果不滿足預設條件,則獲取非特定人聲學數據庫,將提取的待識別語音信號的聲學特征與非特定人聲學數據庫進行模式匹配,尋找最佳匹配于該待識別語音信號的識別結果,并將該識別結果作為該待識別語音信號的最終識別結果進行輸出;
或,獲取非特定人聲學數據庫,將提取的待識別語音信號的聲學特征與非特定人聲學數據庫進行模式匹配,尋找最佳匹配于該待識別語音信號的識別結果;若該最佳匹配的識別結果滿足預設條件,則將該最佳匹配的識別結果作為該待識別語音信號的最終識別結果進行輸出;若無最佳匹配的識別結果或該最佳匹配的識別結果不滿足預設條件,則獲取特定人聲學數據庫,將提取的待識別語音信號的聲學特征與特定人聲學數據庫進行模式匹配,尋找最佳匹配于該待識別語音信號的識別結果,并將該識別結果作為該待識別語音信號的最終識別結果進行輸出;
或,獲取非特定人聲學數據庫和特定人聲學數據庫,將提取的待識別語音信號的聲學特征與非特定人聲學數據庫和特定人聲學數據庫進行模式匹配,尋找非特定人聲學數據庫和特定人聲學數據庫中最佳匹配于該待識別語音信號的識別結果或滿足預設條件的識別結果,并將該識別結果作為該待識別語音信號的最終識別結果進行輸出。
2.如權利要求1所述的語音識別方法,其特征在于,識別后,若輸出的最終識別結果不符合用戶的期望,則:
S31、提供輸入入口供用戶輸入與該待識別語音信號相對應的期望識別結果;
S32、將該期望識別結果與所述待識別語音信號和/或聲學特征建立映射關系以更新所述特定人聲學數據庫。
3.如權利要求1或2所述的語音識別方法,其特征在于,按以下規則建立或更新所述特定人聲學數據庫:
將期望識別結果與相應的語音信號和/或該語音信號的聲學特征整體建立映射,使一項語音信號和/或該語音信號的聲學特征對應一項期望識別結果;
將所述語音信號和/或該語音信號的聲學特征與對應的期望識別結果更新至所述特定人聲學數據庫中。
4.如權利要求1或2所述的語音識別方法,其特征在于,按以下規則更新所述特定人聲學數據庫:
將期望識別結果以語音單元進行劃分,為每個含有語音單元的發音按照聲學建模方式建立聲學模型;
將建立的各個聲學模型及相應的語音單元更新至所述特定人聲學數據庫中。
5.如權利要求1或2所述的語音識別方法,其特征在于,按以下規則更新所述特定人聲學數據庫:
將期望識別結果與相應的語音信號和/或該語音信號的聲學特征整體建立映射,使一項語音信號和/或該語音信號的聲學特征對應一項期望識別結果;
并將期望識別結果以語音單元進行劃分,為每個含有語音單元的發音按照聲學建模方式建立聲學模型;
將所述語音信號和/或該語音信號的聲學特征與對應的期望識別結果及建立的各個聲學模型與相應的語音單元更新至所述特定人聲學數據庫中。
6.如權利要求3所述的語音識別方法,其特征在于,將提取的待識別語音信號的聲學特征與特定人聲學數據庫進行模式匹配時,將待識別語音信號的聲學特征與特定人聲學數據庫中的聲學特征進行比較,確定出最佳匹配于該待識別語音信號的聲學特征的聲學特征所對應的期望識別結果,并將該期望識別結果作為從特定人聲學數據庫中確定出的最佳匹配的識別結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于有愛科技(深圳)有限公司,未經有愛科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710317318.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:聲音對話方法及聲音對話代理服務器
- 下一篇:一種音頻內容查找及可視化播放方法





