[發(fā)明專利]語音識別方法和系統(tǒng)有效
| 申請?zhí)枺?/td> | 201110440273.4 | 申請日: | 2011-12-26 |
| 公開(公告)號: | CN103177721A | 公開(公告)日: | 2013-06-26 |
| 發(fā)明(設(shè)計(jì))人: | 馮克威;趙江 | 申請(專利權(quán))人: | 中國電信股份有限公司 |
| 主分類號: | G10L15/08 | 分類號: | G10L15/08;G10L15/20;G06F17/30 |
| 代理公司: | 中國國際貿(mào)易促進(jìn)委員會專利商標(biāo)事務(wù)所 11038 | 代理人: | 毛麗琴 |
| 地址: | 100032 *** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 語音 識別 方法 系統(tǒng) | ||
1.一種語音識別方法,其特征在于,包括:
從對話語音信息中分別獲取第一講話人的第一語音信息、以及第二講話人的第二語音信息;
分別對第一語音信息和第二語音信息進(jìn)行語音質(zhì)量評估,選擇語音質(zhì)量較好的語音信息作為參考語音信息,將語音質(zhì)量較差的語音信息作為輔助語音信息;
對參考語音信息進(jìn)行語音識別,獲得參考識別信息;
在參考識別信息中,選擇置信度最高的n個詞作為關(guān)鍵詞,n為大于0的正整數(shù);
對于每個關(guān)鍵詞,根據(jù)預(yù)定的詞表生成m級相關(guān)詞集合,其中第一級相關(guān)詞集合中的每個相關(guān)詞分別與一個關(guān)鍵詞相關(guān)聯(lián),第L級相關(guān)詞集合中的每個相關(guān)詞分別與第L-1級相關(guān)詞集合中的一個相關(guān)詞相關(guān)聯(lián),m、L為大于0的正整數(shù),2≤L≤m,在m級相關(guān)詞集合中不包括關(guān)鍵詞,同時在m級相關(guān)詞集合中,相關(guān)詞也不重復(fù)出現(xiàn);
提高關(guān)鍵詞和m級相關(guān)詞集合中的相關(guān)詞在語音識別模型詞庫中的權(quán)重值,其中為每個權(quán)重值乘以一個倍數(shù),關(guān)鍵詞的權(quán)重增加倍數(shù)大于m級相關(guān)詞集合中相關(guān)詞的權(quán)重增加倍數(shù),第L-1級相關(guān)詞集合中相關(guān)詞的權(quán)重增加倍數(shù)大于第L級相關(guān)詞集合中相關(guān)詞的權(quán)重增加倍數(shù),對語音識別模型詞庫中全部詞的權(quán)重值進(jìn)行歸一化處理,得到更新的語音識別模型;
利用更新的語音識別模型,分別對參考語音信息和輔助語音信息進(jìn)行語音識別,得到第一識別信息和第二識別信息。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,
在利用更新的語音識別模型詞庫分別對第一語音信息和第二語音信息進(jìn)行語音識別之后,還包括:
判斷是否需要對參考語音信息和輔助語音信息進(jìn)行迭代處理;
若需要對參考語音信息和輔助語音信息進(jìn)行迭代處理,則執(zhí)行在參考識別信息中選擇置信度最高的n個詞作為關(guān)鍵詞的步驟。
3.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,
關(guān)鍵詞的權(quán)重值大于m級相關(guān)詞集合中相關(guān)詞的權(quán)重值;
第L-1級相關(guān)詞集合中相關(guān)詞的權(quán)重值,大于第L級相關(guān)詞集合中相關(guān)詞的權(quán)重值。
4.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,
所述從對應(yīng)語音信息中分別獲取第一講話人的第一語音信息、以及第二講話人的第二語音信息包括:
在對話語音信息中,從對應(yīng)于第一講話人的的第一路信號中獲取第一語音信息,從對應(yīng)于第二講話人的的第二路信號中獲取第二語音信息。
5.一種語音識別系統(tǒng),其特征在于,包括:
獲取單元,用從對話語音信息中分別獲取第一講話人的第一語音信息、以及第二講話人的第二語音信息;
評估單元,用于分別對第一語音信息和第二語音信息進(jìn)行語音質(zhì)量評估,選擇語音質(zhì)量較好的語音信息作為參考語音信息,將語音質(zhì)量較差的語音信息作為輔助語音信息;
第一語音識別單元,用于對參考語音信息進(jìn)行語音識別,獲得參考識別信息;
關(guān)鍵詞生成單元,用于在參考識別信息中,選擇置信度最高的n個詞作為關(guān)鍵詞,n為大于0的正整數(shù);
相關(guān)詞生成單元,用于對于每個關(guān)鍵詞,根據(jù)預(yù)定的詞表生成m級相關(guān)詞集合,其中第一級相關(guān)詞集合中的每個相關(guān)詞分別與一個關(guān)鍵詞相關(guān)聯(lián),第L級相關(guān)詞集合中的每個相關(guān)詞分別與第L-1級相關(guān)詞集合中的一個相關(guān)詞相關(guān)聯(lián),m、L為大于0的正整數(shù),2≤L≤m,在m級相關(guān)詞集合中不包括關(guān)鍵詞,同時在m級相關(guān)詞集合中,相關(guān)詞也不重復(fù)出現(xiàn);
權(quán)重調(diào)整單元,用于提高關(guān)鍵詞和m級相關(guān)詞集合中的相關(guān)詞在語音識別模型詞庫中的權(quán)重值,其中為每個權(quán)重值乘以一個倍數(shù),關(guān)鍵詞的權(quán)重增加倍數(shù)大于m級相關(guān)詞集合中相關(guān)詞的權(quán)重增加倍數(shù),第L-1級相關(guān)詞集合中相關(guān)詞的權(quán)重增加倍數(shù)大于第L級相關(guān)詞集合中相關(guān)詞的權(quán)重增加倍數(shù),對語音識別模型詞庫中全部詞的權(quán)重值進(jìn)行歸一化處理,得到更新的語音識別模型;
第二語音識別單元,用于利用更新的語音識別模型,分別對參考語音信息和輔助語音信息進(jìn)行語音識別,得到第一識別信息和第二識別信息。
6.根據(jù)權(quán)利要求5所述的系統(tǒng),其特征在于,還包括:
判斷單元,用于在第二語音識別單元利用更新的語音識別模型詞庫分別對第一語音信息和第二語音信息進(jìn)行語音識別之后,判斷是否需要對參考語音信息和輔助語音信息進(jìn)行迭代處理,若需要對參考語音信息和輔助語音信息進(jìn)行迭代處理,則指示選擇單元執(zhí)行在參考識別信息中選擇置信度最高的n個詞作為關(guān)鍵詞的操作。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國電信股份有限公司,未經(jīng)中國電信股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110440273.4/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:腦外科手術(shù)輔助支架
- 下一篇:一種具有提示功能的電子體溫計(jì)





