[發明專利]語音識別方法及系統有效
| 申請號: | 201210073412.9 | 申請日: | 2012-03-19 |
| 公開(公告)號: | CN102592595A | 公開(公告)日: | 2012-07-18 |
| 發明(設計)人: | 潘青華;鹿曉亮;何婷婷;王智國;胡國平;胡郁;劉慶峰 | 申請(專利權)人: | 安徽科大訊飛信息科技股份有限公司 |
| 主分類號: | G10L15/14 | 分類號: | G10L15/14;G10L15/28 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 趙景平;逯長明 |
| 地址: | 230088 安徽*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 識別 方法 系統 | ||
技術領域
本發明涉及語音識別技術領域,特別涉及一種語音識別方法及系統。
背景技術
實現人機之間人性化、智能化的有效交互,構建高效自然的人機交流環境,已經成為當前信息技術應用和發展的迫切需求。近年來,隨著語音識別技術的飛速發展,語音輸入、語音搜索等各種在線語音識別應用受到了越來越多的關注。預先基于海量數據訓練的系統能滿足常用語音輸入撰寫的需要,特別當語音輸入內容符合原語言模型概率分布時識別準確率往往較高。然而在實際應用中,移動互聯網和社交網絡快速發展不斷產生著新的熱點話題及相應的熱點詞匯,不同用戶也存在不同個性化詞匯的識別需求,如聯絡人名等,這些熱點詞匯或個性化詞匯由于時效性和特異性在原始采集的語料中往往出現頻度較低,因而原語言模型對該類詞匯往往覆蓋不足,進而導致相應識別系統不能準確識別該類熱詞。
為此,在現有技術中往往采用系統參數重估的方法,在將新收集的熱詞語料加入原語料庫后,重新訓練新的語言模型以提高對新增熱詞的識別準確率。然而,在實際應用中,熱詞更新頻度往往較高,系統無法及時收集足夠語料參與系統參數重估,進而影響對熱詞的識別效果。另一方面,語言模型的重新訓練以及識別系統資源(如基于WFST(Weighted?Finite-State?Transducers,加權有限狀態轉換器)的解碼識別網絡)的構建往往費時較多,代價較大,無法實現對熱詞識別的快速響應。
發明內容
本發明實施例提供一種語音識別方法及系統,以解決現有技術無法快速、準確識別熱點詞匯及用戶個性化詞匯的技術問題。
為此,本發明實施例提供如下技術方案:
一種語音識別方法,包括:
構建解碼識別網絡;
對接收的語音信號,根據所述解碼識別網絡對其中每幀語音信號幀進行解碼,并在解碼過程中根據熱詞對活躍節點的歷史路徑進行激勵,以提高熱詞所在路徑的累積歷史路徑概率;
在完成對最后一幀語音信號幀解碼后,選擇具有最大累積概率的活躍節點為最優節點;
從所述最優節點通過解碼狀態回溯得到最優路徑及對應的單詞序列。
一種語音識別系統,包括:
網絡構建單元,用于構建解碼識別網絡;
解碼單元,用于對接收的語音信號,根據所述解碼識別網絡對其中每幀語音信號幀進行解碼;
激勵單元,用于在所述解碼單元的解碼過程中根據熱詞對活躍節點的歷史路徑進行激勵,以提高熱詞所在路徑的累積歷史路徑概率;
最優節點確定單元,用于在所述解碼單元完成對最后一幀語音信號幀解碼后,選擇具有最大累積概率的活躍節點為最優節點;
回溯單元,用于從所述最優節點通過解碼狀態回溯得到最優路徑及對應的單詞序列。
本發明實施例語音識別方法及系統,采用基于熱詞匹配對活躍節點的歷史路徑進行激勵,以提高熱詞所在路徑的累積歷史路徑概率,實現了對熱詞識別的有效激勵,提高了熱詞的識別效果。無需系統參數重估,即可快速、準確識別熱點詞匯及用戶個性化詞匯,為系統支持用戶定制的個性化詞庫或個性化語言模型提供了一種可行的解決方案,用戶通過簡單的更新系統支持的熱詞詞條即可實現對個性化詞匯的識別支持。
附圖說明
為了更清楚地說明本發明實施的技術方案,下面將對實施例中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發明的一些實施例,對于本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以根據這些附圖獲得其他的附圖。
圖1是本發明實施例語音識別方法的流程圖;
圖2是本發明實施例中一種基于WFST的解碼識別網絡的示意圖;
圖3是本發明實施例中樹形結構的熱詞詞典的示意圖;
圖4是本發明實施例中根據熱詞集合對解碼得到的歷史路徑進行激勵的一種流程圖;
圖5是本發明實施例中根據熱詞詞典對解碼得到的歷史路徑進行激勵的一種流程圖;
圖6是本發明實施例中根據歷史路徑的擴展結果更新歷史路徑的累積歷史路徑概率的一種實現流程圖;
圖7是本發明實施例中根據歷史路徑的擴展結果更新歷史路徑的累積歷史路徑概率的另一種實現流程圖;
圖8是本發明實施例中熱詞詞典的一種具體示意圖;
圖9是本發明實施例語音識別系統的結構示意圖;
圖10是本發明實施例語音識別系統的一種具體應用結構示意圖;
圖11是本發明實施例語音識別系統的另一種具體應用結構示意圖;
圖12是本發明實施例中激勵子單元的一種結構示意圖;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于安徽科大訊飛信息科技股份有限公司,未經安徽科大訊飛信息科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210073412.9/2.html,轉載請聲明來源鉆瓜專利網。





