[發明專利]一種語音識別系統有效
| 申請號: | 201611101551.2 | 申請日: | 2016-12-05 |
| 公開(公告)號: | CN106653007B | 公開(公告)日: | 2019-07-16 |
| 發明(設計)人: | 沈小正;張光宇;朱孟旭;代大明;肖佳林 | 申請(專利權)人: | 蘇州奇夢者網絡科技有限公司 |
| 主分類號: | G10L15/16 | 分類號: | G10L15/16;G10L15/26;G10L15/28;G10L15/18 |
| 代理公司: | 蘇州市中南偉業知識產權代理事務所(普通合伙) 32257 | 代理人: | 李廣 |
| 地址: | 215000 江蘇省蘇州市吳*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 語音 識別 系統 | ||
本發明涉及一種語音識別系統,由基本的基于聲學模型到拼音映射網絡的基礎識別器和任意多個針對不同應用領域的基于拼音到詞語映射網絡的特定識別器以及一個綜合決策單元共同組成。語音首先通過基礎識別器映射為由多個候選拼音序列組織成的網絡,然后該拼音網絡再通過和一個對應特定應用目標的特定識別器進行組合,最后在組合后的網絡上進行最佳路徑的搜索,得到最終的識別結果。在這種架構下,拼音網絡可以和多個應用領域的單獨的拼音到詞語映射的特定識別器進行組合,最終根據聲學和語言模型評分以及其他應用相關的超級規則選擇最佳的識別結果。
技術領域
本發明涉及語音識別技術領域,尤其涉及一種可以進行在線領域擴展的語音識別系統。
背景技術
漢語不是拼讀語言,如果沒有上下文信息難以直接從音斷定對應的漢字。傳統的語音識別使用預先生成的靜態解碼網絡進行解碼,并且該解碼網絡通常是從音素直接映射為詞語。該解碼網絡融合了要識別的音頻內容的詞語的概率分布信息。這樣導致識別器從一個領域切換到另外一個領域時,性能會急劇下降,另外一些術語和新詞可能總是無法正確識別。為了支持多個領域的識別,通常用一個模型來同時建模多個領域的詞語的概率分布信息。這導致該模型概率分布比較平均(這意味著識別性能通常也比較平均),并且模型比較龐大。為了支持新詞或者術語的識別,必須重新訓練模型和構造識別器。這是非常耗費時間和資源的。
有鑒于上述的缺陷,本設計人,積極加以研究創新,以期創設一種可以進行在線領域擴展的語音識別系統,使其更具有產業上的利用價值。
發明內容
為解決上述技術問題,本發明的目的是提供一種可以進行在線領域擴展,從而可快速提高特定領域的識別性能的語音識別系統。
本發明的語音識別系統,包括
-基于聲學模型到拼音映射網絡的基礎識別器,用于將語音映射為由多個候選拼音序列組織成的網絡;
-多個并列的針對不同應用領域的基于拼音到詞語映射網絡的特定識別器,用于分別與由多個候選拼音序列組織成的網絡進行組合,得到多個最佳詞序列及置信度;
-綜合決策單元,用于接收多個最佳詞序列及置信度,然后根據置信度再加上預先給定的先驗知識和規則以及附加知識,進行決策,選擇最佳的詞序列輸出。
進一步的,通過調整拼音到詞語映射網絡,添加新的識別內容到已有領域的基于拼音到詞語映射網絡的特定識別器中,更新已有領域的識別內容;通過離線構造對應的基于拼音到詞語映射網絡的特定識別器,然后將擴展內容在線添加到基于拼音到詞語映射網絡的特定識別器中,創建新的應用領域的識別內容。
進一步的,所述基于聲學模型到拼音映射網絡的基礎識別器根據輸入的音頻特征動態計算聲學得分,并在其網絡上保存有拼音序列的語言模型得分,采用動態規劃算法結合聲學得分和語言模型得分,搜索得分最高的若干拼音序列輸出。
進一步的,所述拼音序列的語言模型采用基于長短時記憶單元的遞歸神經網絡進行建模。
進一步的,所述綜合決策單元通過融合識別置信度、先驗知識和預設規則以及附加信息來選擇最佳候選詞序列。
進一步的,所述先驗知識至少包括所述語音識別系統之外輸入的關于領域的標識信息,或者根據識別結果歷史信息得到的領域標識信息。
進一步的,所述領域標識信息為離散的0/1置,或連續的概率值。
進一步的,所述預設規則至少包括根據音頻長度預估的詞數范圍。
進一步的,所述附加信息包括根據超級語言模型得到的關于識別結果詞串符合語法規范的程度度量。
進一步的,所述綜合決策單元將所述附加信息和預設規則通過分層加權的方式和置信度評分一起作為決策準則來選擇候選詞序列作為最終識別結果輸出。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘇州奇夢者網絡科技有限公司,未經蘇州奇夢者網絡科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611101551.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:刀柄(160311)
- 下一篇:手柄





