[發明專利]一種語音識別的方法和裝置有效
| 申請號: | 201410205944.2 | 申請日: | 2014-05-15 |
| 公開(公告)號: | CN104021786B | 公開(公告)日: | 2017-05-24 |
| 發明(設計)人: | 喬亞飛;趙芳;游世學;孟凡興;鄭永濤 | 申請(專利權)人: | 北京中科匯聯信息技術有限公司 |
| 主分類號: | G10L15/06 | 分類號: | G10L15/06;G10L15/26 |
| 代理公司: | 北京潤澤恒知識產權代理有限公司11319 | 代理人: | 蘭淑鐸 |
| 地址: | 100083 北京市海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 語音 識別 方法 裝置 | ||
技術領域
本申請涉及語音識別領域,特別是涉及一種語音識別的方法和裝置。
背景技術
近年來,隨著語言處理技術的發展,智能問答系統受到了極大的關注,從聊天軟件‘小黃雞’的風靡,到流行于各大網絡平臺的應答機器人,智能問答系統在眾多領域得到廣泛應用。
大多數問答系統都是以文本鍵入的形式作為問答系統的輸入,繁瑣費時,特別是在移動終端(如手機)等無鍵盤設備上或對于老年人、殘疾人等操作困難人群,文本輸入變得異常困難。因此,基于語音輸入的問答系統應運而生,用戶以口述的形式輸入問題,經過語音識別,把識別結果傳給問答系統進行處理,這樣減少了用戶的操作,提高了用戶體驗。
語音智能問答系統具有方便、快捷、適用人群廣泛的優點,然而,將語音作為用戶輸入帶來了新的問題。由于用戶的聲音質量的不確定性、環境噪聲的多樣性、用戶口音變異、未登錄詞等各種復雜因素的影響,語音識別的精度很難保證。現有技術中語音識別技術對標準普通話的識別正確率大約在90%左右,如果存在較高的噪音和口音,識別率的正確率就大大降低了。錯誤的識別結果會影響問答系統對用戶輸入的理解,進而影響問答系統的正確率。
目前,解決上述問題的方法是通過增加問答系統的知識領域來提高語音識別系統的準確率。然而上述方法,一方面存在著某些語音識別錯誤在后續問答系統中擴大,導致問答系統正確率急劇下降。另一方面,問答系統本身在容錯時容易忽略非關鍵字,在此情形下對輸入問題進行模糊匹配時,將導致問答系統輸出錯誤結果的可能性大大增加。
發明內容
本申請提供一種語音識別的方法和裝置,以解決上述現有語音識別錯誤對問答系統影響的問題。
為了解決上述問題,本申請公開了一種語音識別的方法,包括:接收語音識別系統輸出的多個候選識別結果,將所述多個候選識別結果分別與知識庫中的模板進行匹配,其中,所述知識庫包括實體詞表和模板,所述實體詞表存儲實體詞,所述模板存儲符合正則表達式的書寫規則語句;
若所述多個候選識別結果與知識庫中的模板匹配均不成功,則計算多個候選識別結果與知識庫中存儲的模板的距離;
根據所述距離和多個候選識別結果的信任度得到多個候選識別結果的匹配分值,根據所述匹配分值將所述多個候選識別結果分別與知識庫中的模板進行匹配,得到所述多個候選識別結果與知識庫中的模板的匹配度;
根據所述匹配度,輸出匹配后的識別結果。
優選地,所述計算多個候選識別結果與知識庫中存儲的模板的距離的步驟包括:
通過編輯距離修正公式計算多個候選識別結果與知識庫中存儲的模板的距離,包括:
通過第一編輯距離修正公式,計算多個候選識別結果與知識庫中存儲的模板的第一距離,其中,所述第一編輯距離修正公式用于根據多個候選識別結果的字符串轉換為知識庫中存儲的模板的字符串的距離和插入錯誤的算法參數得到多個候選識別結果與知識庫中存儲模板之間的距離;
通過第二編輯距離修正公式,計算多個候選識別結果與知識庫中存儲的模板的第二距離,其中,所述第二編輯距離修正公式用于根據多個候選識別結果的字符串轉換為知識庫中存儲的模板的字符串的距離和刪除錯誤的算法參數得到多個候選識別結果與知識庫中存儲模板之間的距離;
通過第三編輯距離修正公式,計算多個候選識別結果與知識庫中存儲的模板的第三距離,其中,所述第三編輯距離修正公式用于根據多個候選識別結果的字符串轉換為知識庫中存儲的模板的字符串的距離和多個候選識別結果字符串的音素與知識庫中存儲的模板的字符串的標準音素的失配分值得到多個候選識別結果與知識庫中存儲模板之間的距離;
將所述第一距離、第二距離和第三距離中的最小值確定為所述多個候選識別結果與知識庫中存儲的模板的距離。
優選地,所述第一編輯距離修正公式為:D(N,M)=D(i-1,j)+c;
所述第二編輯距離修正公式為:D(N,M)=D(i,j-1)+v;
所述第三編輯距離修正公式為:D(N,M)=D(i-1,j-1)+d(w,v);
其中,i為多個候選識別結果的字符串,j為知識庫中存儲的模板的字符串,c和v為算法參數,c為插入錯誤失配權重,v為刪除錯誤失配權重,d(w,v)為多個候選識別結果第i-1個字符串的音素與知識庫中存儲的模板的第j-1個字符串的標準音素的失配分值,D(N,M)為多個候選識別結果與知識庫中存儲的模板的距離。
優選地,所述d(w,v)通過以下方式獲得:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京中科匯聯信息技術有限公司,未經北京中科匯聯信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410205944.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:具有帶變化直徑的冷卻通道的渦輪機部件
- 下一篇:一種用于加工汽車轉向節的夾具





