[發(fā)明專利]一種語音信息識別方法、裝置、電子設(shè)備及存儲介質(zhì)有效

申請?zhí)枺?/td>	202111115243.6	申請日：	2021-09-23
公開（公告）號：	CN113555006B	公開（公告）日：	2021-12-10
發(fā)明（設(shè)計）人：	康健;黃申	申請（專利權(quán)）人：	騰訊科技（深圳）有限公司
主分類號：	G10L15/02	分類號：	G10L15/02;G10L15/16;G10L15/26;G06F40/289;G06F40/30;G06N3/04;G06N3/08
代理公司：	北京派特恩知識產(chǎn)權(quán)代理有限公司 11270	代理人：	崔曉嵐;張穎玲
地址：	518000 廣東省深圳***	國省代碼：	廣東;44
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	一種語音信息識別方法裝置電子設(shè)備存儲介質(zhì)
鉆瓜網(wǎng) 技術(shù)展會專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【說明書】：

本發(fā)明提供了一種語音信息識別方法，包括：通過語音信息識別模型中的聲學(xué)子模型對字音特征向量進(jìn)行處理，得到至少一個語音識別結(jié)果；通過語音信息識別模型中的語言子模型對語音識別結(jié)果進(jìn)行語義識別處理，得到語音識別結(jié)果對應(yīng)的文字通順度；根據(jù)不同語音識別結(jié)果所分別對應(yīng)的文字通順度進(jìn)行篩選，以實現(xiàn)對目標(biāo)語音信息的識別，由此，可以高效地對待識別語音信息進(jìn)行識別，同時能夠使得語音識別模型的泛化能力更強(qiáng)，有利于語音識別模型在各類型智能設(shè)備中的大規(guī)模部署，另外通過語音信息識別模型不僅省去了人工標(biāo)注混淆集的繁瑣步驟，而且可以減少由于近似讀音對語音信息識別的干擾，對近似讀音的語音信息的識別準(zhǔn)確度更高，提升用戶的使用體驗。

技術(shù)領(lǐng)域

本發(fā)明涉及信息處理技術(shù)，尤其涉及語音信息識別方法、裝置、電子設(shè)備及存儲介質(zhì)。

背景技術(shù)

隨著機(jī)器學(xué)習(xí)技術(shù)的發(fā)展，機(jī)器學(xué)習(xí)可以通過相應(yīng)的語音識別模型機(jī)制實現(xiàn)，并且可以結(jié)合云技術(shù)實現(xiàn)，云技術(shù)是指在廣域網(wǎng)或局域網(wǎng)內(nèi)將硬件、軟件及網(wǎng)絡(luò)等系列資源統(tǒng)一起來，實現(xiàn)數(shù)據(jù)的計算、儲存、處理和共享的一種托管技術(shù)，也可理解為基于云計算商業(yè)模式應(yīng)用的網(wǎng)絡(luò)技術(shù)、信息技術(shù)、整合技術(shù)、管理平臺技術(shù)及應(yīng)用技術(shù)等的總稱。技術(shù)網(wǎng)絡(luò)系統(tǒng)的后臺服務(wù)需要大量的計算、存儲資源，如視頻網(wǎng)站、圖片類網(wǎng)站和更多的門戶網(wǎng)站，因此云技術(shù)需要以云計算作為支撐。

需要說明的是，云計算是一種計算模式，它將計算任務(wù)分布在大量計算機(jī)構(gòu)成的資源池上，使各種應(yīng)用系統(tǒng)能夠根據(jù)需要獲取計算力、存儲空間和信息服務(wù)。提供資源的網(wǎng)絡(luò)被稱為“云”。“云”中的資源在使用者看來是可以無限擴(kuò)展的，并且可以隨時獲取，按需使用，隨時擴(kuò)展，按使用付費。作為云計算的基礎(chǔ)能力提供商，會建立云計算資源池平臺，簡稱云平臺，一般稱為基礎(chǔ)設(shè)施即服務(wù)(IaaS，Infrastructure as a Service)，在資源池中部署多種類型的虛擬資源，供外部客戶選擇使用。云計算資源池中主要包括：計算設(shè)備(可為虛擬化機(jī)器，包含操作系統(tǒng))、存儲設(shè)備和網(wǎng)絡(luò)設(shè)備。但是，在使用神經(jīng)網(wǎng)絡(luò)模型對應(yīng)的模型對語音數(shù)據(jù)進(jìn)行處理的過程中，對于數(shù)字類語音信息場景的指令識別中，由于用戶語句的發(fā)音多種多樣較為復(fù)雜，交互成功率較低，影響用戶的使用體驗。因此，在特定目標(biāo)類型場景下對用戶意圖識別精度要求更高，智能設(shè)備需要懂得如何準(zhǔn)確地響應(yīng)用戶的語音指令語句。

發(fā)明內(nèi)容

有鑒于此，本發(fā)明實施例提供一種語音信息識別方法、裝置、電子設(shè)備及存儲介質(zhì)，本發(fā)明實施例的技術(shù)方案是這樣實現(xiàn)的：

本發(fā)明實施例提供了一種語音信息識別方法，包括：

獲取目標(biāo)語音信息，并且對所述目標(biāo)語音信息進(jìn)行特征提取處理，得到待識別語音信息；

通過語音信息識別模型中的聲學(xué)子模型對所述待識別語音信息進(jìn)行字音識別處理，得到所述待識別語音信息對應(yīng)的字音特征向量；

通過語音信息識別模型中的聲學(xué)子模型對所述字音特征向量進(jìn)行處理，得到至少一個語音識別結(jié)果；

通過語音信息識別模型中的語言子模型對所述語音識別結(jié)果進(jìn)行語義識別處理，得到所述語音識別結(jié)果對應(yīng)的文字通順度；

根據(jù)不同語音識別結(jié)果所分別對應(yīng)的文字通順度進(jìn)行篩選，獲得對所述目標(biāo)語音信息的識別結(jié)果。

本發(fā)明實施例還提供了一種語音信息識別裝置，所述裝置包括：

信息傳輸模塊，用于獲取目標(biāo)語音信息，并且對所述目標(biāo)語音信息進(jìn)行特征提取處理，得到待識別語音信息；

信息處理模塊，用于通過語音信息識別模型中的聲學(xué)子模型對所述待識別語音信息進(jìn)行字音識別處理，得到所述待識別語音信息對應(yīng)的字音特征向量；

所述信息處理模塊，用于通過語音信息識別模型中的聲學(xué)子模型對所述字音特征向量進(jìn)行處理，得到至少一個語音識別結(jié)果；

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于騰訊科技（深圳）有限公司，未經(jīng)騰訊科技（深圳）有限公司許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202111115243.6/2.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

同類專利

專利分類

G 物理

G10 樂器；聲學(xué)
G10L 語音分析或合成；語音識別；音頻分析或處理
G10L15-00 語音識別
G10L15-02 .語音識別的特征提取；識別單位的選擇
G10L15-04 .分段或字極限檢測
G10L15-06 .創(chuàng)建基準(zhǔn)模板；訓(xùn)練語音識別系統(tǒng)，例如對說話者聲音特征的適應(yīng)
G10L15-08 .語音分類或檢索
G10L15-20 .專門適用于不利環(huán)境

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻(xiàn)下載

說明：

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實用新型專利、外觀設(shè)計專利（升級中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進(jìn)行下載，點擊【登陸】【注冊】