[發明專利]一種基于場景的實時語音識別系統和方法有效
| 申請號: | 201410407362.2 | 申請日: | 2014-08-19 |
| 公開(公告)號: | CN105448292B | 公開(公告)日: | 2019-03-12 |
| 發明(設計)人: | 雷欣;沈李斌 | 申請(專利權)人: | 北京羽扇智信息科技有限公司 |
| 主分類號: | G10L15/06 | 分類號: | G10L15/06;G10L15/28 |
| 代理公司: | 北京知呱呱知識產權代理有限公司 11577 | 代理人: | 馮建基 |
| 地址: | 100080 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 場景 實時 語音 識別 系統 方法 | ||
本發明提供了一種實時語音識別系統和方法。該實時語音識別方法包括:采集當前用戶的當前語音和當前場景信息;構建當前用戶對應的當前場景語言模型;根據當前場景信息判斷當前場景的類型,并從根據歷史場景信息而構建的與不同場景類型相對應的靜態語言模型中搜索與當前場景的類型相對應的靜態語言模型;調用通用語言模型,基于通用語言模型、搜索出的靜態語言模型、當前用戶對應的場景語言模型的混合以及聲學模型,識別當前用戶的語音。本發明實施例通過結合各類場景信息以線下和線上相結合的方式構建語言模型,可以有效提升識別語音的準確率。
技術領域
本發明涉及語音識別技術,尤其涉及一種基于場景的實時語音識別系統和方法。
背景技術
現有的語音識別中,通?;诟黝I域語料組建的通用語言模型,結合相應的聲學模型來識別語音對應的文本。其中的通用語言模型中的語料一般比較龐雜、更新速度較慢,沒有針對性,導致語音識別結果往往準確性不高。特別對于同音或近似的語音,現有的語音識別技術并不能較好地提供準確的識別結果,例如,采集到用戶的語音為“xinxinjie”,現有的語音識別技術并不能較好地判斷該語音對應的文本是“新星街”還是“欣欣街”還是其他相似文本。
發明內容
本發明解決的技術問題之一是提升語音識別的準確率。
根據本發明的一個方面的一個實施例,提供了一種基于場景的實時語音識別系統,包括:
語音采集裝置,被配置為采集當前用戶的當前語音;
靜態語言模型構建裝置,被配置為基于采集的歷史場景信息,構建與不同場景類型相對應的靜態語言模型;
場景語言模型構建裝置,被配置為實時采集當前用戶的當前場景信息,構建當前用戶對應的當前場景語言模型;
語音識別裝置,被配置為根據當前場景信息判斷當前場景的類型,并從根據歷史場景信息而構建的與不同場景類型相對應的靜態語言模型中搜索與當前場景的類型相對應的靜態語言模型,調用通用語言模型,基于通用語言模型、搜索出的靜態語言模型、當前用戶對應的場景語言模型的混合以及聲學模型,識別當前用戶的語音。
現有技術的實時語音識別系統只用通用語言模型識別,通用語言模型不針對具體的場景,而類型的場景中很多對話上下文會重復出現,因此,利用基于具體的場景的模型識別可以提高實時語音識別的準確度和效率。由于本發明的實施例通過統計和分析大量的歷史場景信息,構建與不同場景類型相對應的靜態語言模型,也即為不同的場景類型關聯不同的靜態語言模型,這種針對場景的模型識別有利于提升語音識別的準確性;另外,本實施例通過在線實時構建對應的當前場景語言模型,這種實時構建的語言模型進一步結合了當前用戶的個性化信息,提升了語音識別的準確性。
根據本發明的一個實施例,所述語音識別裝置包括:
并行計算單元,被配置為并行計算當前用戶的當前語音的各候選識別結果在通用語言模型、搜索出的靜態語言模型和當前用戶對應的當前場景語言模型下的概率分數;
識別單元,被配置為基于各模型對應的權重對各候選識別結果在各模型下的概率分數進行加權,根據加權后的概率分數對各候選識別結果進行排序,識別當前用戶的當前語音對應的文本。
由于本實施例并行計算各語言模型下的概率分數,而不是順序計算,可以有效保證語音識別的實時性。
根據本發明的一個實施例,場景信息包括大致地理位置、時間、周邊人物、周邊活動,場景的類型是由大致地理位置、時間、周邊人物、周邊活動中的一項或多項限定的,靜態語言模型構建裝置根據歷史場景信息而構建的與不同場景類型相對應的靜態語言模型是如下構建的:
將歷史語料按照場景分類至特定場景的類型中,每個特定場景的類型對應于一個靜態語言模型,用特定場景的類型下的歷史語料訓練相應靜態語言模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京羽扇智信息科技有限公司,未經北京羽扇智信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410407362.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:填充變換編碼音頻信號中的非編碼子向量
- 下一篇:一種新型吉他護板





