[發(fā)明專利]智能語(yǔ)音評(píng)測(cè)方法及系統(tǒng)有效
| 申請(qǐng)?zhí)枺?/td> | 201611199626.5 | 申請(qǐng)日: | 2016-12-22 |
| 公開(公告)號(hào): | CN106782603B | 公開(公告)日: | 2020-08-11 |
| 發(fā)明(設(shè)計(jì))人: | 郭偉 | 申請(qǐng)(專利權(quán))人: | 云知聲(上海)智能科技有限公司 |
| 主分類號(hào): | G10L25/30 | 分類號(hào): | G10L25/30;G10L25/51;G10L15/02;G10L15/04;G10L17/02 |
| 代理公司: | 上海唯源專利代理有限公司 31229 | 代理人: | 曾耀先 |
| 地址: | 200233 上海市徐*** | 國(guó)省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 智能 語(yǔ)音 評(píng)測(cè) 方法 系統(tǒng) | ||
1.一種智能語(yǔ)音評(píng)測(cè)方法,其特征在于,包括以下步驟:
a.提供第一訓(xùn)練數(shù)據(jù)集,所述第一訓(xùn)練數(shù)據(jù)集包括測(cè)試語(yǔ)種數(shù)據(jù)集和對(duì)比語(yǔ)種數(shù)據(jù)集,所述測(cè)試語(yǔ)種數(shù)據(jù)集和對(duì)比語(yǔ)種數(shù)據(jù)集均包括音頻數(shù)據(jù)、文本數(shù)據(jù)及其對(duì)應(yīng)的音素集合,提供所述音素集合之間的映射關(guān)系;
b.訓(xùn)練深度神經(jīng)網(wǎng)絡(luò),利用所述第一訓(xùn)練數(shù)據(jù)集對(duì)深度神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,所述測(cè)試語(yǔ)種數(shù)據(jù)集和對(duì)比語(yǔ)種數(shù)據(jù)集一同輸入到所述深度神經(jīng)網(wǎng)絡(luò)中進(jìn)行訓(xùn)練,以形成深度神經(jīng)網(wǎng)絡(luò)模型;
c.提供第二訓(xùn)練數(shù)據(jù)集,對(duì)深度神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,所述第二訓(xùn)練數(shù)據(jù)集包括至少兩種語(yǔ)種數(shù)據(jù)集,定義一種語(yǔ)種數(shù)據(jù)集為測(cè)試語(yǔ)種數(shù)據(jù)集,其他語(yǔ)種數(shù)據(jù)集為對(duì)比語(yǔ)種數(shù)據(jù)集,所述測(cè)試語(yǔ)種數(shù)據(jù)集和對(duì)比語(yǔ)種數(shù)據(jù)集分別輸入到所述深度神經(jīng)網(wǎng)絡(luò)中進(jìn)行訓(xùn)練,所述測(cè)試語(yǔ)種數(shù)據(jù)集和對(duì)比語(yǔ)種數(shù)據(jù)集均包括音頻數(shù)據(jù)、文本數(shù)據(jù)及其對(duì)應(yīng)的音素集合;所述第二訓(xùn)練數(shù)據(jù)集的測(cè)試語(yǔ)種數(shù)據(jù)集和對(duì)比語(yǔ)種數(shù)據(jù)集分別被提供以進(jìn)行所述音素集合之間的映射;
d.獲取待評(píng)測(cè)語(yǔ)音,提取所述待評(píng)測(cè)語(yǔ)音的特征序列,將所述特征序列輸入到所述深度神經(jīng)網(wǎng)絡(luò)模型中;對(duì)所述待評(píng)測(cè)語(yǔ)音進(jìn)行識(shí)別以形成音素序列;
e.輸出對(duì)應(yīng)所述音素序列的評(píng)測(cè)分值;所述評(píng)測(cè)分值包括:
第一類節(jié)點(diǎn),其對(duì)應(yīng)為使用所述第一訓(xùn)練數(shù)據(jù)集進(jìn)行訓(xùn)練后的輸出評(píng)測(cè)分值;
第二類節(jié)點(diǎn),其對(duì)應(yīng)為使用所述測(cè)試語(yǔ)種數(shù)據(jù)集進(jìn)行訓(xùn)練后的輸出評(píng)測(cè)分值;
第三類節(jié)點(diǎn),其對(duì)應(yīng)為使用所述對(duì)比語(yǔ)種數(shù)據(jù)集進(jìn)行訓(xùn)練后的輸出評(píng)測(cè)分值;
f.通過線性融合或非線性融合的方式對(duì)所述第一類節(jié)點(diǎn)、第二類節(jié)點(diǎn)及第三類節(jié)點(diǎn)的評(píng)測(cè)分值進(jìn)行處理。
2.根據(jù)權(quán)利要求1所述的智能語(yǔ)音評(píng)測(cè)方法,其特征在于:在所述步驟f中,定義第一類節(jié)點(diǎn)輸出的評(píng)測(cè)分值為第一分值Score1,定義第二類節(jié)點(diǎn)輸出的評(píng)測(cè)分值為第二分值Score2,定義第三類節(jié)點(diǎn)輸出的評(píng)測(cè)分值為第三Score3;其中:
若第二分值Score2高于第三分值Score3且第二分值Score2與第三分值Score3的差值大,判斷獲取的語(yǔ)音為使用測(cè)試語(yǔ)種數(shù)據(jù)集對(duì)應(yīng)的語(yǔ)音,輸出第二分值Score2為評(píng)測(cè)結(jié)果;
若第二分值Score2高于第三分值Score3且第二分值Score2與第三分值Score3的差值小,則在對(duì)評(píng)測(cè)分值進(jìn)行處理時(shí),需對(duì)第二分值Score2和第三分值Score3進(jìn)行加權(quán)處理以降低第三分值Score3對(duì)評(píng)測(cè)結(jié)果的影響,將加權(quán)處理后的結(jié)果作為評(píng)測(cè)結(jié)果進(jìn)行輸出;
若第二分值Score2低于第三分值Score3且第二分值Score2與第三分值Score3的差值大,判斷所獲取的待評(píng)測(cè)語(yǔ)音為利用其它語(yǔ)種形式閱讀形成,亦需要對(duì)第二分值Score2和第三分值Score3進(jìn)行加權(quán)處理以輸出正確的評(píng)測(cè)結(jié)果。
3.根據(jù)權(quán)利要求1所述的智能語(yǔ)音評(píng)測(cè)方法,其特征在于:在所述步驟f中,定義第一類節(jié)點(diǎn)輸出的評(píng)測(cè)分值為第一分值Score1,定義第二類節(jié)點(diǎn)輸出的評(píng)測(cè)分值為第二分值Score2,定義第三類節(jié)點(diǎn)輸出的評(píng)測(cè)分值為第三Score3;其中,利用線性疊加的原理進(jìn)行處理評(píng)測(cè)結(jié)果,包括:
第三分值Score3較高,第二分值Score2較低:評(píng)測(cè)結(jié)果S=a*(Score2+Score3),a取值為0.1或0.2;
第三分值Score3高,第二分值Score2偏高,但比第三分值Score3低:評(píng)測(cè)結(jié)果S=a*(Score2+Score3),a取值為0.3或0.4;
第三分值Score3很低,第二分值Score2很高:評(píng)測(cè)結(jié)果S=a*(Score1+Score2),a取值為0.5;這種情況說明待評(píng)測(cè)語(yǔ)音說的較為標(biāo)準(zhǔn),第一分值Score1會(huì)較高。
4.根據(jù)權(quán)利要求1所述的智能語(yǔ)音評(píng)測(cè)方法,其特征在于:在所述步驟a中,不同語(yǔ)種發(fā)音相似的音素映射成一套音素集合,發(fā)音不能映射的音素標(biāo)記為單獨(dú)的音素。
5.根據(jù)權(quán)利要求4所述的智能語(yǔ)音評(píng)測(cè)方法,其特征在于:所述測(cè)試語(yǔ)種數(shù)據(jù)集為英文,所述對(duì)比語(yǔ)種數(shù)據(jù)集包括中文,中文帶調(diào)音素和英文音素映射為一套音素集合。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于云知聲(上海)智能科技有限公司,未經(jīng)云知聲(上海)智能科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611199626.5/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 用于語(yǔ)音處理的方法與系統(tǒng)
- 一種語(yǔ)音識(shí)別測(cè)試系統(tǒng)及方法
- 用于語(yǔ)音識(shí)別的方法和裝置
- 一種語(yǔ)音消毒柜的控制方法及語(yǔ)音消毒柜
- 一種語(yǔ)音處理方法及裝置
- 混合語(yǔ)音識(shí)別方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 語(yǔ)音情緒識(shí)別方法、系統(tǒng)、移動(dòng)終端及存儲(chǔ)介質(zhì)
- 一種具有語(yǔ)音識(shí)別功能的智能語(yǔ)音終端設(shè)備
- 語(yǔ)音增強(qiáng)方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 一種聲紋鑒定語(yǔ)音重組方法和系統(tǒng)
- 一種操作系統(tǒng)安全功能評(píng)測(cè)方法及系統(tǒng)
- IP核質(zhì)量自動(dòng)評(píng)測(cè)方法和系統(tǒng)
- 一種物品評(píng)測(cè)方法及裝置
- 處理器性能評(píng)測(cè)比較方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種數(shù)據(jù)評(píng)測(cè)方法、裝置、設(shè)備及可讀存儲(chǔ)介質(zhì)
- 智能評(píng)測(cè)設(shè)備及系統(tǒng)
- 一種性能信息獲取方法、裝置及存儲(chǔ)介質(zhì)
- 一種語(yǔ)音識(shí)別的評(píng)測(cè)方法及系統(tǒng)
- 一種基于區(qū)塊鏈的安卓軟件評(píng)測(cè)方法及設(shè)備、介質(zhì)
- 智能評(píng)測(cè)設(shè)備及系統(tǒng)
- 一種數(shù)據(jù)庫(kù)讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





