[發(fā)明專利]借助語(yǔ)種識(shí)別輔助語(yǔ)音評(píng)測(cè)的方法及系統(tǒng)在審
| 申請(qǐng)?zhí)枺?/td> | 202010785964.7 | 申請(qǐng)日: | 2020-08-07 |
| 公開(kāi)(公告)號(hào): | CN111986650A | 公開(kāi)(公告)日: | 2020-11-24 |
| 發(fā)明(設(shè)計(jì))人: | 牛傳迎 | 申請(qǐng)(專利權(quán))人: | 云知聲智能科技股份有限公司;廈門(mén)云知芯智能科技有限公司 |
| 主分類(lèi)號(hào): | G10L15/00 | 分類(lèi)號(hào): | G10L15/00;G10L15/06;G10L15/02;G10L25/51 |
| 代理公司: | 北京冠和權(quán)律師事務(wù)所 11399 | 代理人: | 安琪 |
| 地址: | 100000 北京市海*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 借助 語(yǔ)種 識(shí)別 輔助 語(yǔ)音 評(píng)測(cè) 方法 系統(tǒng) | ||
1.一種借助語(yǔ)種識(shí)別輔助語(yǔ)音評(píng)測(cè)的方法,其特征在于,所述方法執(zhí)行以下步驟:
步驟1:根據(jù)基于待檢測(cè)語(yǔ)音數(shù)據(jù)所建立的多層級(jí)聲學(xué)建模單元的分?jǐn)?shù)映射,得到初始評(píng)測(cè)得分;
步驟2:對(duì)所述待檢測(cè)語(yǔ)音數(shù)據(jù)進(jìn)行語(yǔ)種識(shí)別,得到語(yǔ)種識(shí)別結(jié)果;
步驟3:根據(jù)所述初始評(píng)測(cè)得分和所述語(yǔ)種識(shí)別結(jié)果,得到語(yǔ)音評(píng)測(cè)結(jié)果。
2.如權(quán)利要求1所述的方法,其特征在于,在所述步驟1中,所述多層級(jí)聲學(xué)建模單元包括:音素層級(jí)建模單元、單詞層級(jí)建模單元和句子層級(jí)建模單元。
3.如權(quán)利要求2所述的方法,其特征在于,所述步驟1:根據(jù)基于待檢測(cè)語(yǔ)音數(shù)據(jù)所建立的多層級(jí)聲學(xué)建模單元的分?jǐn)?shù)映射,得到初始評(píng)測(cè)得分執(zhí)行以下步驟:
步驟S11:提取所述待檢測(cè)語(yǔ)音數(shù)據(jù)中的聲學(xué)特征,經(jīng)過(guò)語(yǔ)音識(shí)別網(wǎng)絡(luò)計(jì)算,得到音素層級(jí)的GOP后驗(yàn)概率和音素層級(jí)的置信分?jǐn)?shù);
步驟S12:根據(jù)所述音素層級(jí)的GOP后驗(yàn)概率的平均值,得到單詞層級(jí)的后驗(yàn)概率,根據(jù)所述音素層級(jí)的置信分?jǐn)?shù)的平均值,得到單詞層級(jí)的置信分?jǐn)?shù);
步驟S13:根據(jù)所述單詞層級(jí)的置信分?jǐn)?shù)和所述單詞層級(jí)的后驗(yàn)概率的加權(quán)平均,得到句子層級(jí)的分?jǐn)?shù),并統(tǒng)計(jì)句子中單詞后驗(yàn)概率打零分的比例;
步驟S14:根據(jù)所述句子層級(jí)的分?jǐn)?shù)和所述句子中單詞后驗(yàn)概率打零分的比例,得到句子的初始評(píng)測(cè)得分。
4.如權(quán)利要求3所述的方法,其特征在于,在所述步驟S11中,根據(jù)以下公式確定所述音素層級(jí)的GOP后驗(yàn)概率:
其中,GOP(pi)表示第i個(gè)音素的GOP后驗(yàn)概率,ts表示音素的起始時(shí)間,te表示音素的結(jié)束時(shí)間,P(Oi|pi;ts,te)表示第i個(gè)觀測(cè)矢量Oi在模型pi下的似然分?jǐn)?shù),按照強(qiáng)制對(duì)齊從解碼路徑中獲得,maxq∈QP(Oi|q;ts,te)按照文本相關(guān)的音素循環(huán)網(wǎng)絡(luò)近似獲得,Q表示參考文本中所有音素模型的集合;
在所述步驟S11中,基于語(yǔ)音識(shí)別網(wǎng)絡(luò),通過(guò)前后向算法獲得所述音素層級(jí)的置信分?jǐn)?shù)picm,picm表示第i個(gè)音素的置信分?jǐn)?shù);
在所述步驟S12中,根據(jù)以下公式確定所述單詞層級(jí)的后驗(yàn)概率,
其中,Wk表示第k個(gè)單詞的后驗(yàn)概率,N表示單詞所含音素個(gè)數(shù);
在所述步驟S12中,根據(jù)以下公式確定所述單詞層級(jí)的置信分?jǐn)?shù),
其中,Wkcm表示第k個(gè)單詞的置信分?jǐn)?shù);
在所述步驟S13中,根據(jù)以下公式確定所述句子層級(jí)的分?jǐn)?shù),
其中,Sr表示第r個(gè)句子的置信分?jǐn)?shù);M表示句子中的單詞個(gè)數(shù),β分別為加權(quán)系數(shù),滿足M0,0≤β≤1,且
在所述步驟S13中,根據(jù)以下公式統(tǒng)計(jì)句子中單詞后驗(yàn)概率打零分的比例,
其中,zmatch表示句子中單詞后驗(yàn)概率打零分的比例,IntegrityAll=Count(Wmatch+Wdel+Wsub),IntegrityAll表示依據(jù)DTW算法計(jì)算識(shí)別結(jié)果和參考文本中匹配的、刪除的和替換的單詞總個(gè)數(shù);
在所述步驟S14中,根據(jù)以下公式確定句子的初始評(píng)測(cè)得分,
其中,t1表示zmatch閾值,t2表示Sr閾值。
5.如權(quán)利要求1所述的方法,其特征在于,所述步驟2:對(duì)所述待檢測(cè)語(yǔ)音數(shù)據(jù)進(jìn)行語(yǔ)種識(shí)別,得到語(yǔ)種識(shí)別結(jié)果執(zhí)行以下步驟:
步驟S21:將待檢測(cè)語(yǔ)音轉(zhuǎn)化為語(yǔ)種向量,其中所述語(yǔ)種向量代表語(yǔ)種信息;
步驟S22:根據(jù)所述語(yǔ)種向量和與各語(yǔ)種模型對(duì)應(yīng)的模型語(yǔ)種向量對(duì)比,得到語(yǔ)種識(shí)別結(jié)果。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于云知聲智能科技股份有限公司;廈門(mén)云知芯智能科技有限公司,未經(jīng)云知聲智能科技股份有限公司;廈門(mén)云知芯智能科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010785964.7/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類(lèi)專利
- 專利分類(lèi)
- 支持多語(yǔ)種接口的電子裝置及方法
- 一種模塊化語(yǔ)種解析裝置及其實(shí)現(xiàn)方法
- 一種終端語(yǔ)種的配置方法及裝置
- 一種多語(yǔ)種文字歸碼轉(zhuǎn)傳裝置及方法
- 一種語(yǔ)種識(shí)別方法、裝置、翻譯機(jī)、介質(zhì)和設(shè)備
- 自動(dòng)識(shí)別語(yǔ)種的翻譯方法、裝置及設(shè)備
- 一種語(yǔ)種識(shí)別模型訓(xùn)練、語(yǔ)種識(shí)別的方法和相關(guān)裝置
- 語(yǔ)種識(shí)別方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 語(yǔ)種識(shí)別方法
- 人機(jī)對(duì)話方法、裝置、計(jì)算機(jī)設(shè)備及可讀存儲(chǔ)介質(zhì)
- 識(shí)別媒體、識(shí)別媒體的識(shí)別方法、識(shí)別對(duì)象物品以及識(shí)別裝置
- 一種探針卡識(shí)別裝置和方法
- 識(shí)別裝置、識(shí)別方法以及記錄介質(zhì)
- 識(shí)別裝置、識(shí)別系統(tǒng),識(shí)別方法以及存儲(chǔ)介質(zhì)
- 識(shí)別程序、識(shí)別方法以及識(shí)別裝置
- 車(chē)載身份識(shí)別方法及系統(tǒng)
- 車(chē)載身份識(shí)別方法及系統(tǒng)
- 車(chē)載身份識(shí)別方法及系統(tǒng)
- 識(shí)別裝置、識(shí)別方法以及識(shí)別程序
- 識(shí)別裝置、識(shí)別方法及識(shí)別程序





