[發明專利]語音識別裝置和語音識別方法在審
| 申請號: | 201780088586.3 | 申請日: | 2017-03-24 |
| 公開(公告)號: | CN110447068A | 公開(公告)日: | 2019-11-12 |
| 發明(設計)人: | 花澤利行;成田知宏 | 申請(專利權)人: | 三菱電機株式會社 |
| 主分類號: | G10L15/10 | 分類號: | G10L15/10;G10L15/20 |
| 代理公司: | 北京三友知識產權代理有限公司 11127 | 代理人: | 馬建軍;鄧毅 |
| 地址: | 日本*** | 國省代碼: | 日本;JP |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 特征向量 似然度 聲學 噪聲度 噪聲 特征向量計算 語音數據 重新計算 計算特征向量 語音識別裝置 似然度計算 重新計算部 判別模型 聲學模型 輸出語音 語音識別 計算部 詞匯 語音 | ||
1.一種語音識別裝置,該語音識別裝置具有:
第1特征向量計算部,其根據輸入的語音數據計算第1特征向量;
聲學似然度計算部,其使用用于計算特征向量的聲學似然度的聲學模型,計算所述第1特征向量計算部計算出的第1特征向量的聲學似然度;
第2特征向量計算部,其根據所述語音數據計算第2特征向量;
噪聲度計算部,其使用用于計算表示特征向量是噪聲還是語音的噪聲度的判別模型,計算所述第2特征向量計算部計算出的第2特征向量的噪聲度;
噪聲似然度重新計算部,其根據所述聲學似然度計算部計算出的所述第1特征向量的聲學似然度和所述噪聲度計算部計算出的所述第2特征向量的噪聲度,重新計算噪聲的聲學似然度;以及
對照部,其使用所述聲學似然度計算部計算出的聲學似然度和所述噪聲似然度重新計算部重新計算出的噪聲的聲學似然度,進行與作為識別對象的詞匯模式之間的對照,輸出所述語音數據的識別結果。
2.根據權利要求1所述的語音識別裝置,其特征在于,
所述第2特征向量計算部計算與所述第1特征向量計算部計算出的所述第1特征向量相同的特征向量,作為所述第2特征向量。
3.根據權利要求2所述的語音識別裝置,其特征在于,
所述聲學模型是具有一層以上的中間層的神經網絡,
所述判別模型是對所述聲學模型的神經網的中間層或輸出層追加0層以上的中間層和一層的輸出層而得到的神經網絡,僅學習所述追加的中間層和輸出層的參數。
4.根據權利要求1所述的語音識別裝置,其特征在于,
所述第2特征向量計算部計算與所述第1特征向量計算部計算出的所述第1特征向量不同的一維以上的特征向量,作為所述第2特征向量。
5.根據權利要求3所述的語音識別裝置,其特征在于,
所述聲學模型是具有一層以上的中間層的神經網絡,
所述判別模型是對所述聲學模型的神經網的中間層或輸出層追加0層以上的中間層和一層的輸出層而得到的神經網絡,追加所述第2特征向量計算部計算出的第2特征向量的特征量作為輸入到所述追加的最初的中間層或輸出層的輸入數據,僅學習所述追加的中間層和輸出層的參數。
6.一種語音識別方法,該語音識別方法具有以下步驟:
第1特征向量計算部根據輸入的語音數據計算第1特征向量;
聲學似然度計算部使用用于計算特征向量的聲學似然度的聲學模型,計算所述第1特征向量的聲學似然度;
第2特征向量計算部根據所述語音數據計算第2特征向量;
噪聲度計算部使用用于計算表示特征向量是噪聲還是語音的噪聲度的判別模型,計算所述第2特征向量的噪聲度;
噪聲似然度重新計算部根據所述第1特征向量的聲學似然度和所述第2特征向量的噪聲度,重新計算噪聲的聲學似然度;以及
對照部使用所述計算出的聲學似然度和所述重新計算出的噪聲的聲學似然度,進行與作為識別對象的詞匯模式之間的對照,輸出所述語音數據的識別結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于三菱電機株式會社,未經三菱電機株式會社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201780088586.3/1.html,轉載請聲明來源鉆瓜專利網。





