[發(fā)明專利]區(qū)分地域性口音的語音數(shù)據(jù)識別方法和裝置無效
| 申請?zhí)枺?/td> | 201310703949.3 | 申請日: | 2013-12-19 |
| 公開(公告)號: | CN103680493A | 公開(公告)日: | 2014-03-26 |
| 發(fā)明(設(shè)計(jì))人: | 蘇丹;尹釗 | 申請(專利權(quán))人: | 百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司 |
| 主分類號: | G10L15/00 | 分類號: | G10L15/00;G10L15/06 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 胡彬 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 區(qū)分 地域性 口音 語音 數(shù)據(jù) 識別 方法 裝置 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及語音數(shù)據(jù)處理技術(shù)領(lǐng)域,尤其涉及一種區(qū)分地域性口音的語音數(shù)據(jù)識別方法和裝置。
背景技術(shù)
我國幅員遼闊,這使得漢語中包含地域性口音的方言的種類眾多。來自不同地方的方言在發(fā)音特點(diǎn),語速特點(diǎn)上各不相同。所以,采用相同的聲學(xué)模型對不同地方的方言進(jìn)行語音識別時(shí),會出現(xiàn)識別準(zhǔn)確率不高的現(xiàn)象。為了解決采用統(tǒng)一的適用于漢語普通話的聲學(xué)模型對不同地方方言進(jìn)行語音識別時(shí)識別準(zhǔn)確率不高的問題,針對不同地方的方言分別訓(xùn)練為各種方言定制的聲學(xué)模型是一種很好的途徑。
訓(xùn)練聲學(xué)模型需要海量的訓(xùn)練數(shù)據(jù)。目前,隨著微信、米聊等即時(shí)通訊工具的流行,互聯(lián)網(wǎng)上存儲有大量的原始語音數(shù)據(jù)。這些語音數(shù)據(jù)可以作為訓(xùn)練針對不同地方方言的聲學(xué)模型的訓(xùn)練數(shù)據(jù)。但是,現(xiàn)有技術(shù)中,沒有從這些語音數(shù)據(jù)中區(qū)分哪些是普通話的語音數(shù)據(jù),哪些是地域性語音數(shù)據(jù)的自動化方法,使得要使用原始語音數(shù)據(jù)訓(xùn)練針對地方方言的聲學(xué)模型之前,首先需要對這些原始語音數(shù)據(jù)人工標(biāo)注出地域標(biāo)簽,這會耗費(fèi)大量人力物力。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例提出一種區(qū)分地域性口音的語音數(shù)據(jù)識別方法和裝置,以從原始語音數(shù)據(jù)中自動識別出地域性語音數(shù)據(jù)。
第一方面,本發(fā)明實(shí)施例提供了一種區(qū)分地域性口音的語音數(shù)據(jù)識別方法,所述方法包括:
計(jì)算語音數(shù)據(jù)的語音識別置信度和/或信噪比,并根據(jù)語音識別置信度和/或信噪比從語音數(shù)據(jù)中篩選出地域性語音數(shù)據(jù);
根據(jù)所述地域性語音數(shù)據(jù)的地域?qū)傩源_定所述地域性語音數(shù)據(jù)的所屬地域。
第二方面,本發(fā)明實(shí)施例提供了一種區(qū)分地域性口音的語音數(shù)據(jù)識別裝置,所述裝置包括:
語音數(shù)據(jù)篩選模塊,用于計(jì)算語音數(shù)據(jù)的語音識別置信度和/或信噪比,并根據(jù)語音識別置信度和/或信噪比從語音數(shù)據(jù)中篩選出地域性語音數(shù)據(jù);
地域確定模塊,用于根據(jù)所述地域性語音數(shù)據(jù)的地域?qū)傩源_定所述地域性語音數(shù)據(jù)的所屬地域。
本發(fā)明實(shí)施例提供的區(qū)分地域性口音的語音數(shù)據(jù)識別方法和裝置,通過計(jì)算語音數(shù)據(jù)的置信度和/或信噪比,將地域性語音數(shù)據(jù)自動的從海量的語音數(shù)據(jù)中篩選出來,減少了對全部語音數(shù)據(jù)進(jìn)行人工標(biāo)注的工作量,提高了語音數(shù)據(jù)處理的效率。
附圖說明
通過閱讀參照以下附圖所作的對非限制性實(shí)施例所作的詳細(xì)描述,本發(fā)明的其它特征、目的和優(yōu)點(diǎn)將會變得更明顯:
圖1是本發(fā)明第一實(shí)施例提供的區(qū)分地域性口音的語音數(shù)據(jù)識別方法的流程圖;
圖2是本發(fā)明第一實(shí)施例提供的區(qū)分地域性口音的語音數(shù)據(jù)識別方法的信號流圖;
圖3是本發(fā)明第二實(shí)施例提供的區(qū)分地域性口音的語音數(shù)據(jù)識別方法的流程圖;
圖4是本發(fā)明第二實(shí)施例提供的區(qū)分地域性口音的語音數(shù)據(jù)識別方法中信噪比計(jì)算的流程圖;
圖5是本發(fā)明第二實(shí)施例提供的區(qū)分地域性口音的語音數(shù)據(jù)識別方法的信號流圖;
圖6是本發(fā)明第三實(shí)施例提供的區(qū)分地域性口音的語音數(shù)據(jù)識別裝置的結(jié)構(gòu)圖。
具體實(shí)施方式
下面結(jié)合附圖和實(shí)施例對本發(fā)明作進(jìn)一步的詳細(xì)說明??梢岳斫獾氖?,此處所描述的具體實(shí)施例僅僅用于解釋本發(fā)明,而非對本發(fā)明的限定。另外還需要說明的是,為了便于描述,附圖中僅示出了與本發(fā)明相關(guān)的部分而非全部內(nèi)容。
圖1及圖2示出了本發(fā)明的第一實(shí)施例。
圖1是本發(fā)明第一實(shí)施例提供的區(qū)分地域性口音的語音數(shù)據(jù)識別方法的流程圖。參見圖1,所述區(qū)分地域性口音的語音數(shù)據(jù)識別方法包括:
S110,計(jì)算語音數(shù)據(jù)的語音識別置信度和/或信噪比,并根據(jù)語音識別置信度和/或信噪比從語音數(shù)據(jù)中篩選出地域性語音數(shù)據(jù)。
因?yàn)楝F(xiàn)有技術(shù)中用于語音識別的聲學(xué)模型都是針對低噪音并且沒有地域性口音的標(biāo)準(zhǔn)普通話語音訓(xùn)練的聲學(xué)模型。當(dāng)使用這些聲學(xué)模型來對地域性語音數(shù)據(jù)進(jìn)行語音識別時(shí),會出現(xiàn)語音識別置信度不高,進(jìn)而語音識別的識別率不高的情況。正因?yàn)榈赜蛐哉Z音數(shù)據(jù)有進(jìn)行語音識別時(shí)語音識別置信度不高的特征,所以可以計(jì)算地域性語音數(shù)據(jù)的語音識別置信度,再根據(jù)計(jì)算的地域性語音數(shù)據(jù)的語音識別置信度篩選出地域性語音數(shù)據(jù)。
然而,造成語音數(shù)據(jù)的語音識別置信度不高的原因也可能是因?yàn)檎Z音數(shù)據(jù)中有較高的噪聲。所述還可以通過計(jì)算語音數(shù)據(jù)的信噪比,將語音數(shù)據(jù)中信噪比較低的語音數(shù)據(jù)濾除,以清除由于低信噪比造成其語音識別置信度低的語音數(shù)據(jù)。將語音數(shù)據(jù)中信噪比較低的語音數(shù)據(jù)清除以后,剩下的語音數(shù)據(jù)就是由于地域性口音造成語音識別置信度不高的語音數(shù)據(jù),也即地域性語音數(shù)據(jù)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司,未經(jīng)百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310703949.3/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:光信息記錄裝置
- 下一篇:移動終端及其控制方法
- 一種基于深度學(xué)習(xí)技術(shù)的自動口音分類方法及裝置
- 一種云端語音識別系統(tǒng)及方法
- 基于口音瓶頸特征的聲學(xué)模型自適應(yīng)方法
- 一種方言語言的識別方法及虛擬現(xiàn)實(shí)教學(xué)方法和系統(tǒng)
- 用于口音轉(zhuǎn)化的系統(tǒng)和方法
- 一種基于口音識別的魯棒語音識別方法
- 語音識別方法、裝置、設(shè)備、存儲介質(zhì)及空調(diào)
- 一種端到端的口音轉(zhuǎn)換方法
- 識別模型構(gòu)建方法、語音識別方法、電子設(shè)備及存儲介質(zhì)
- 口音語音識別方法、裝置、設(shè)備及存儲介質(zhì)





