[發(fā)明專(zhuān)利]一種領(lǐng)域自適應(yīng)語(yǔ)音識(shí)別方法和裝置有效
| 申請(qǐng)?zhí)枺?/td> | 201710232856.5 | 申請(qǐng)日: | 2017-04-11 |
| 公開(kāi)(公告)號(hào): | CN107154260B | 公開(kāi)(公告)日: | 2020-06-16 |
| 發(fā)明(設(shè)計(jì))人: | 郭祥;郭瑞;雷宇 | 申請(qǐng)(專(zhuān)利權(quán))人: | 北京儒博科技有限公司 |
| 主分類(lèi)號(hào): | G10L15/06 | 分類(lèi)號(hào): | G10L15/06;G10L15/183 |
| 代理公司: | 北京衛(wèi)平智業(yè)專(zhuān)利代理事務(wù)所(普通合伙) 11392 | 代理人: | 張新利 |
| 地址: | 101500 北京市密云區(qū)經(jīng)濟(jì)開(kāi)發(fā)*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 領(lǐng)域 自適應(yīng) 語(yǔ)音 識(shí)別 方法 裝置 | ||
1.一種領(lǐng)域自適應(yīng)語(yǔ)音識(shí)別方法,其特征在于,包括:
基于初始音頻語(yǔ)料進(jìn)行訓(xùn)練,建立初始聲學(xué)模型,以及基于初始文本語(yǔ)料進(jìn)行訓(xùn)練,建立初始語(yǔ)言模型;
進(jìn)行行業(yè)領(lǐng)域語(yǔ)料搜集和處理,基于處理后的行業(yè)領(lǐng)域語(yǔ)料進(jìn)行訓(xùn)練,建立行業(yè)領(lǐng)域語(yǔ)言模型;
基于所述初始語(yǔ)言模型和所述行業(yè)領(lǐng)域語(yǔ)言模型進(jìn)行適配計(jì)算,建立混合語(yǔ)言模型;
基于處理后的行業(yè)領(lǐng)域語(yǔ)料進(jìn)行音素聚類(lèi),根據(jù)音素聚類(lèi)結(jié)果進(jìn)行訓(xùn)練,建立聚類(lèi)聲學(xué)模型;
對(duì)所述初始聲學(xué)模型和所述聚類(lèi)聲學(xué)模型進(jìn)行融合,建立融合聲學(xué)模型;
接收輸入的語(yǔ)音信號(hào),基于所述融合聲學(xué)模型和混合語(yǔ)言模型確定所述語(yǔ)音信號(hào)對(duì)應(yīng)的詞語(yǔ)序列。
2.根據(jù)權(quán)利要求1所述的領(lǐng)域自適應(yīng)語(yǔ)音識(shí)別方法,其特征在于,所述初始語(yǔ)言模型是二元n-gram語(yǔ)言模型。
3.根據(jù)權(quán)利要求1所述的領(lǐng)域自適應(yīng)語(yǔ)音識(shí)別方法,其特征在于,所述進(jìn)行行業(yè)領(lǐng)域語(yǔ)料搜集和處理,基于處理后的行業(yè)領(lǐng)域語(yǔ)料進(jìn)行訓(xùn)練,建立行業(yè)領(lǐng)域語(yǔ)言模型包括:
搜集與所述行業(yè)領(lǐng)域相關(guān)的語(yǔ)料,從所述語(yǔ)料中提取句子文本和專(zhuān)有名詞;
對(duì)所述專(zhuān)有名詞進(jìn)行分類(lèi)整理,建立專(zhuān)有名詞詞表;
基于所述專(zhuān)有名詞詞表對(duì)所述句子文本進(jìn)行專(zhuān)有名詞標(biāo)注和替換,得到包含專(zhuān)有名詞詞表標(biāo)記詞的句子文本;
以所述包含專(zhuān)有名詞詞表標(biāo)記詞的句子文本作為訓(xùn)練語(yǔ)料進(jìn)行訓(xùn)練,建立行業(yè)領(lǐng)域語(yǔ)言模型。
4.根據(jù)權(quán)利要求1所述的領(lǐng)域自適應(yīng)語(yǔ)音識(shí)別方法,其特征在于,所述基于所述初始語(yǔ)言模型和所述行業(yè)領(lǐng)域語(yǔ)言模型進(jìn)行適配計(jì)算,建立混合語(yǔ)言模型包括:
對(duì)所述初始語(yǔ)言模型和所述行業(yè)領(lǐng)域語(yǔ)言模型進(jìn)行概率加權(quán)計(jì)算,建立混合語(yǔ)言模型。
5.根據(jù)權(quán)利要求4所述的領(lǐng)域自適應(yīng)語(yǔ)音識(shí)別方法,其特征在于,對(duì)所述初始語(yǔ)言模型和所述行業(yè)領(lǐng)域語(yǔ)言模型進(jìn)行概率加權(quán)計(jì)算,建立混合語(yǔ)言模型包括:
當(dāng)初始文本語(yǔ)料和行業(yè)領(lǐng)域語(yǔ)料中都包含詞語(yǔ)組合wi-1wi時(shí),或者當(dāng)初始文本語(yǔ)料中包含詞語(yǔ)組合wi-1wi且行業(yè)領(lǐng)域語(yǔ)料中不包含詞語(yǔ)組合wi-1wi時(shí),按照以下公式(1)計(jì)算所述混合語(yǔ)言模型對(duì)應(yīng)的條件概率:
P_mix(wi|wi-1)={XM*old_count(wi-1,wi)+YM*new_count(wi-1,wi)}/{XM*old_count(wi-1)+YM*new_count(wi-1)} (1)
其中,
XM=old_total_count/(old_total_count+new_total_count),
YM=new_total_count/(old_total_count+new_total_count),
其中,P_mix(wi|wi-1)表示所述混合語(yǔ)言模型對(duì)應(yīng)的條件概率,wi-1和wi表示詞語(yǔ)序列W中的兩個(gè)相鄰詞語(yǔ),W=w1w2…wn,1i≤n,XM、YM分別表示針對(duì)所述初始語(yǔ)言模型和所述行業(yè)領(lǐng)域語(yǔ)言模型設(shè)置的加權(quán)系數(shù),old_count(wi-1,wi)表示在所述初始文本語(yǔ)料中詞語(yǔ)組合wi-1wi出現(xiàn)的次數(shù),old_cout(wi-1)表示在所述初始文本語(yǔ)料中詞語(yǔ)wi-1出現(xiàn)的次數(shù),new_count(wi-1,wi)表示在所述行業(yè)領(lǐng)域語(yǔ)料中詞語(yǔ)組合wi-1wi出現(xiàn)的次數(shù),new_cout(wi-1)表示在所述行業(yè)領(lǐng)域語(yǔ)料中詞語(yǔ)wi-1出現(xiàn)的次數(shù),old_total_count表示所述初始文本語(yǔ)料中的總詞數(shù),new_total_count表示所述行業(yè)領(lǐng)域語(yǔ)料中的總詞數(shù)。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于北京儒博科技有限公司,未經(jīng)北京儒博科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710232856.5/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 上一篇:熱式流量計(jì)
- 下一篇:提高非硅化電阻模型精度的方法及非硅化電阻模型
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G10L 語(yǔ)音分析或合成;語(yǔ)音識(shí)別;音頻分析或處理
G10L15-00 語(yǔ)音識(shí)別
G10L15-02 .語(yǔ)音識(shí)別的特征提取;識(shí)別單位的選擇
G10L15-04 .分段或字極限檢測(cè)
G10L15-06 .創(chuàng)建基準(zhǔn)模板;訓(xùn)練語(yǔ)音識(shí)別系統(tǒng),例如對(duì)說(shuō)話(huà)者聲音特征的適應(yīng)
G10L15-08 .語(yǔ)音分類(lèi)或檢索
G10L15-20 .專(zhuān)門(mén)適用于不利環(huán)境
- 使用后向自適應(yīng)規(guī)則進(jìn)行整數(shù)數(shù)據(jù)的無(wú)損自適應(yīng)Golomb/Rice編碼和解碼
- 一種自適應(yīng)軟件UML建模及其形式化驗(yàn)證方法
- 媒體自適應(yīng)參數(shù)的調(diào)整方法、系統(tǒng)及相關(guān)設(shè)備
- 五自由度自適應(yīng)位姿調(diào)整平臺(tái)
- 采用自適應(yīng)機(jī)匣和自適應(yīng)風(fēng)扇的智能發(fā)動(dòng)機(jī)
- 一種自適應(yīng)樹(shù)木自動(dòng)涂白裝置
- 一種基于微服務(wù)的多層次自適應(yīng)方法
- 一種天然氣發(fā)動(dòng)機(jī)燃?xì)庾赃m應(yīng)控制方法及系統(tǒng)
- 一種中心自適應(yīng)的焊接跟蹤機(jī)頭
- 一種有砟軌道沉降自適應(yīng)式軌道系統(tǒng)
- 用于語(yǔ)音處理的方法與系統(tǒng)
- 一種語(yǔ)音識(shí)別測(cè)試系統(tǒng)及方法
- 用于語(yǔ)音識(shí)別的方法和裝置
- 一種語(yǔ)音消毒柜的控制方法及語(yǔ)音消毒柜
- 一種語(yǔ)音處理方法及裝置
- 混合語(yǔ)音識(shí)別方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 語(yǔ)音情緒識(shí)別方法、系統(tǒng)、移動(dòng)終端及存儲(chǔ)介質(zhì)
- 一種具有語(yǔ)音識(shí)別功能的智能語(yǔ)音終端設(shè)備
- 語(yǔ)音增強(qiáng)方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 一種聲紋鑒定語(yǔ)音重組方法和系統(tǒng)
- 識(shí)別媒體、識(shí)別媒體的識(shí)別方法、識(shí)別對(duì)象物品以及識(shí)別裝置
- 一種探針卡識(shí)別裝置和方法
- 識(shí)別裝置、識(shí)別方法以及記錄介質(zhì)
- 識(shí)別裝置、識(shí)別系統(tǒng),識(shí)別方法以及存儲(chǔ)介質(zhì)
- 識(shí)別程序、識(shí)別方法以及識(shí)別裝置
- 車(chē)載身份識(shí)別方法及系統(tǒng)
- 車(chē)載身份識(shí)別方法及系統(tǒng)
- 車(chē)載身份識(shí)別方法及系統(tǒng)
- 識(shí)別裝置、識(shí)別方法以及識(shí)別程序
- 識(shí)別裝置、識(shí)別方法及識(shí)別程序





