[發(fā)明專利]一種語音信息識別方法、裝置、電子設(shè)備及存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 202111115243.6 | 申請日: | 2021-09-23 |
| 公開(公告)號: | CN113555006B | 公開(公告)日: | 2021-12-10 |
| 發(fā)明(設(shè)計)人: | 康健;黃申 | 申請(專利權(quán))人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G10L15/02 | 分類號: | G10L15/02;G10L15/16;G10L15/26;G06F40/289;G06F40/30;G06N3/04;G06N3/08 |
| 代理公司: | 北京派特恩知識產(chǎn)權(quán)代理有限公司 11270 | 代理人: | 崔曉嵐;張穎玲 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 語音 信息 識別 方法 裝置 電子設(shè)備 存儲 介質(zhì) | ||
本發(fā)明提供了一種語音信息識別方法,包括:通過語音信息識別模型中的聲學(xué)子模型對字音特征向量進(jìn)行處理,得到至少一個語音識別結(jié)果;通過語音信息識別模型中的語言子模型對語音識別結(jié)果進(jìn)行語義識別處理,得到語音識別結(jié)果對應(yīng)的文字通順度;根據(jù)不同語音識別結(jié)果所分別對應(yīng)的文字通順度進(jìn)行篩選,以實現(xiàn)對目標(biāo)語音信息的識別,由此,可以高效地對待識別語音信息進(jìn)行識別,同時能夠使得語音識別模型的泛化能力更強(qiáng),有利于語音識別模型在各類型智能設(shè)備中的大規(guī)模部署,另外通過語音信息識別模型不僅省去了人工標(biāo)注混淆集的繁瑣步驟,而且可以減少由于近似讀音對語音信息識別的干擾,對近似讀音的語音信息的識別準(zhǔn)確度更高,提升用戶的使用體驗。
技術(shù)領(lǐng)域
本發(fā)明涉及信息處理技術(shù),尤其涉及語音信息識別方法、裝置、電子設(shè)備及存儲介質(zhì)。
背景技術(shù)
隨著機(jī)器學(xué)習(xí)技術(shù)的發(fā)展,機(jī)器學(xué)習(xí)可以通過相應(yīng)的語音識別模型機(jī)制實現(xiàn),并且可以結(jié)合云技術(shù)實現(xiàn),云技術(shù)是指在廣域網(wǎng)或局域網(wǎng)內(nèi)將硬件、軟件及網(wǎng)絡(luò)等系列資源統(tǒng)一起來,實現(xiàn)數(shù)據(jù)的計算、儲存、處理和共享的一種托管技術(shù),也可理解為基于云計算商業(yè)模式應(yīng)用的網(wǎng)絡(luò)技術(shù)、信息技術(shù)、整合技術(shù)、管理平臺技術(shù)及應(yīng)用技術(shù)等的總稱。技術(shù)網(wǎng)絡(luò)系統(tǒng)的后臺服務(wù)需要大量的計算、存儲資源,如視頻網(wǎng)站、圖片類網(wǎng)站和更多的門戶網(wǎng)站,因此云技術(shù)需要以云計算作為支撐。
需要說明的是,云計算是一種計算模式,它將計算任務(wù)分布在大量計算機(jī)構(gòu)成的資源池上,使各種應(yīng)用系統(tǒng)能夠根據(jù)需要獲取計算力、存儲空間和信息服務(wù)。提供資源的網(wǎng)絡(luò)被稱為“云”。“云”中的資源在使用者看來是可以無限擴(kuò)展的,并且可以隨時獲取,按需使用,隨時擴(kuò)展,按使用付費。作為云計算的基礎(chǔ)能力提供商,會建立云計算資源池平臺,簡稱云平臺,一般稱為基礎(chǔ)設(shè)施即服務(wù)(IaaS,Infrastructure as a Service),在資源池中部署多種類型的虛擬資源,供外部客戶選擇使用。云計算資源池中主要包括:計算設(shè)備(可為虛擬化機(jī)器,包含操作系統(tǒng))、存儲設(shè)備和網(wǎng)絡(luò)設(shè)備。但是,在使用神經(jīng)網(wǎng)絡(luò)模型對應(yīng)的模型對語音數(shù)據(jù)進(jìn)行處理的過程中,對于數(shù)字類語音信息場景的指令識別中,由于用戶語句的發(fā)音多種多樣較為復(fù)雜,交互成功率較低,影響用戶的使用體驗。因此,在特定目標(biāo)類型場景下對用戶意圖識別精度要求更高,智能設(shè)備需要懂得如何準(zhǔn)確地響應(yīng)用戶的語音指令語句。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明實施例提供一種語音信息識別方法、裝置、電子設(shè)備及存儲介質(zhì),本發(fā)明實施例的技術(shù)方案是這樣實現(xiàn)的:
本發(fā)明實施例提供了一種語音信息識別方法,包括:
獲取目標(biāo)語音信息,并且對所述目標(biāo)語音信息進(jìn)行特征提取處理,得到待識別語音信息;
通過語音信息識別模型中的聲學(xué)子模型對所述待識別語音信息進(jìn)行字音識別處理,得到所述待識別語音信息對應(yīng)的字音特征向量;
通過語音信息識別模型中的聲學(xué)子模型對所述字音特征向量進(jìn)行處理,得到至少一個語音識別結(jié)果;
通過語音信息識別模型中的語言子模型對所述語音識別結(jié)果進(jìn)行語義識別處理,得到所述語音識別結(jié)果對應(yīng)的文字通順度;
根據(jù)不同語音識別結(jié)果所分別對應(yīng)的文字通順度進(jìn)行篩選,獲得對所述目標(biāo)語音信息的識別結(jié)果。
本發(fā)明實施例還提供了一種語音信息識別裝置,所述裝置包括:
信息傳輸模塊,用于獲取目標(biāo)語音信息,并且對所述目標(biāo)語音信息進(jìn)行特征提取處理,得到待識別語音信息;
信息處理模塊,用于通過語音信息識別模型中的聲學(xué)子模型對所述待識別語音信息進(jìn)行字音識別處理,得到所述待識別語音信息對應(yīng)的字音特征向量;
所述信息處理模塊,用于通過語音信息識別模型中的聲學(xué)子模型對所述字音特征向量進(jìn)行處理,得到至少一個語音識別結(jié)果;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于騰訊科技(深圳)有限公司,未經(jīng)騰訊科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111115243.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 信息記錄介質(zhì)、信息記錄方法、信息記錄設(shè)備、信息再現(xiàn)方法和信息再現(xiàn)設(shè)備
- 信息記錄裝置、信息記錄方法、信息記錄介質(zhì)、信息復(fù)制裝置和信息復(fù)制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄設(shè)備、信息重放設(shè)備、信息記錄方法、信息重放方法、以及信息記錄介質(zhì)
- 信息存儲介質(zhì)、信息記錄方法、信息重放方法、信息記錄設(shè)備、以及信息重放設(shè)備
- 信息存儲介質(zhì)、信息記錄方法、信息回放方法、信息記錄設(shè)備和信息回放設(shè)備
- 信息記錄介質(zhì)、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置





