[發明專利]語音識別方法及系統有效
| 申請號: | 201710317318.6 | 申請日: | 2017-05-04 |
| 公開(公告)號: | CN108806691B | 公開(公告)日: | 2020-10-16 |
| 發明(設計)人: | 任寶剛 | 申請(專利權)人: | 有愛科技(深圳)有限公司 |
| 主分類號: | G10L15/26 | 分類號: | G10L15/26;G10L15/02 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 518000 廣東省深圳市南山*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 識別 方法 系統 | ||
一種語言識別方法及系統,其通過用戶輸入的特定的語音信號和相應的期望識別結果而建立特定人聲學數據庫,從而使得下次進行語音識別時,可通過特定人聲學數據庫和非特定人聲學數據庫兩種數據庫進行模式匹配,從而確定出最佳匹配于待識別語音信號的識別結果。由于特定人聲學數據庫是由特定用戶建立的,因而其更符合用戶的語音習慣,因此對于特定人而言,其識別準確度將大大提高。本發明的語音識別方法,不僅可對非特定人輸入的語音信號進行準確的識別,也可對特定人輸入的語音信號進行準確識別,從而利于發音不標準、發音帶有特定口音的用戶進行使用,擴大語音識別的應用范圍,提高語音識別的準確度。
【技術領域】
本發明涉及語音識別,特別涉及一種面向特定人和非特定人的語音識別方法及系統。
【背景技術】
語音識別技術是通過機器的識別和理解過程將人發出的聲音、字節或短語轉換成相應的文字或符號,或者給出響應的一種信息技術。隨著信息技術的飛速發展,語音識別技術已經廣泛應用于人們的日常生活中。例如,使用終端設備時,采用語音識別技術可以通過輸入語音的方式方便地在終端設備中輸入信息。
語音識別技術的本質上是一種模式識別的過程,未知語音的模式與已知語音的參考模式逐一進行比較,最佳匹配的參考模式被作為識別結果輸出。現有的語音識別技術采用的識別方法有多種,例如模型匹配法、概率模型法等。目前業界普遍采用的是概率模型法語音識別技術。概率模型法語音識別技術,是通過云端對大量的不同用戶輸入的語音進行聲學訓練,而得到一個通用的聲學模型,根據所述通用的聲學模型及語音模型將待識別的語音信號解碼為文本輸出。這種識別方法,主要是針對非特定人而言,其可對大部分人的語音進行識別,但是,由于其是通用的聲學模型,當用戶發音不夠標準,或者帶有地方口音時,這種通用的聲學模型便無法準確的進行匹配計算,從而導致其識別結果準確度降低,不利于特定用戶,尤其是發音不標準,有地方口音的用戶進行使用。
【發明內容】
本發明旨在解決上述問題,而提供一種可提高語音識別準確度,既可對非特定人進行準確的語音識別,也可對特定人進行準確的語音識別的語音識別方法及裝置。
為實現上述目的,本發明提供了一種語音識別方法,其特征在于,識別時,其包括:
S1、接收用戶輸入的待識別語音信號,并從輸入的待識別語音信號中提取出可表征該待識別語音信號的聲學特征;
S2、獲取特定人聲學數據庫,將提取的待識別語音信號的聲學特征與特定人聲學數據庫進行模式匹配,尋找最佳匹配于該待識別語音信號的識別結果;若該最佳匹配的識別結果滿足預設條件,則將該最佳匹配的識別結果作為該待識別語音信號的最終識別結果進行輸出;若無最佳匹配的識別結果或該最佳匹配的識別結果不滿足預設條件,則獲取非特定人聲學數據庫,將提取的待識別語音信號的聲學特征與非特定人聲學數據庫進行模式匹配,尋找最佳匹配于該待識別語音信號的識別結果,并將該識別結果作為該待識別語音信號的最終識別結果進行輸出;
或,獲取非特定人聲學數據庫,將提取的待識別語音信號的聲學特征與非特定人聲學數據庫進行模式匹配,尋找最佳匹配于該待識別語音信號的識別結果;若該最佳匹配的識別結果滿足預設條件,則將該最佳匹配的識別結果作為該待識別語音信號的最終識別結果進行輸出;若無最佳匹配的識別結果或該最佳匹配的識別結果不滿足預設條件,則獲取特定人聲學數據庫,將提取的待識別語音信號的聲學特征與特定人聲學數據庫進行模式匹配,尋找最佳匹配于該待識別語音信號的識別結果,并將該識別結果作為該待識別語音信號的最終識別結果進行輸出;
或,獲取非特定人聲學數據庫和特定人聲學數據庫,將提取的待識別語音信號的聲學特征與非特定人聲學數據庫和特定人聲學數據庫進行模式匹配,尋找非特定人聲學數據庫和特定人聲學數據庫中最佳匹配于該待識別語音信號的識別結果或滿足預設條件的識別結果,并將該識別結果作為該待識別語音信號的最終識別結果進行輸出。
進一步地,識別前,可選的,還包括以下步驟:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于有愛科技(深圳)有限公司,未經有愛科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710317318.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:聲音對話方法及聲音對話代理服務器
- 下一篇:一種音頻內容查找及可視化播放方法





