[發(fā)明專利]音頻信號(hào)識(shí)別方法、裝置、設(shè)備、系統(tǒng)和存儲(chǔ)介質(zhì)有效
| 申請?zhí)枺?/td> | 201811148191.0 | 申請日: | 2018-09-29 |
| 公開(公告)號(hào): | CN111063338B | 公開(公告)日: | 2023-09-19 |
| 發(fā)明(設(shè)計(jì))人: | 薛少飛 | 申請(專利權(quán))人: | 阿里巴巴集團(tuán)控股有限公司 |
| 主分類號(hào): | G10L15/02 | 分類號(hào): | G10L15/02;G10L15/06;G10L15/16;G10L15/18;G10L15/26;G10L17/04;G10L17/26 |
| 代理公司: | 北京東方億思知識(shí)產(chǎn)權(quán)代理有限責(zé)任公司 11258 | 代理人: | 吳崇 |
| 地址: | 開曼群島*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 音頻 信號(hào) 識(shí)別 方法 裝置 設(shè)備 系統(tǒng) 存儲(chǔ) 介質(zhì) | ||
本發(fā)明實(shí)施例公開了一種音頻信號(hào)識(shí)別方法、裝置、設(shè)備、系統(tǒng)和存儲(chǔ)介質(zhì),該方法包括:針對接收的音頻信號(hào),確定音頻信號(hào)中是否包括特定音頻信號(hào);如果音頻信號(hào)中包括特定音頻信號(hào),基于語音識(shí)別模型組件處理音頻信號(hào),得到音頻信號(hào)中語音識(shí)別單元的識(shí)別概率,語音識(shí)別模型組件包括特定聲學(xué)模型和非特定聲學(xué)模型;利用語言模型對音頻信號(hào)中語音識(shí)別單元的識(shí)別概率進(jìn)行聲學(xué)解碼,得到音頻信號(hào)的文本識(shí)別結(jié)果。根據(jù)本發(fā)明實(shí)施例提供的音頻信號(hào)識(shí)別方法,可以提高音頻信號(hào)識(shí)別準(zhǔn)確率。
技術(shù)領(lǐng)域
本發(fā)明涉及計(jì)算機(jī)領(lǐng)域,尤其涉及一種音頻信號(hào)識(shí)別方法、裝置、設(shè)備、系統(tǒng)和存儲(chǔ)介質(zhì)。
背景技術(shù)
隨著音頻信號(hào)識(shí)別技術(shù)的不斷發(fā)展,音頻信號(hào)識(shí)別技術(shù)在汽車駕駛領(lǐng)域、智能家居、智能商務(wù)系統(tǒng)等領(lǐng)域得到了廣泛的應(yīng)用,音頻信號(hào)識(shí)別技術(shù)可以通過對音頻信號(hào)的識(shí)別,準(zhǔn)確地執(zhí)行相應(yīng)的功能。
現(xiàn)階段,音頻信號(hào)識(shí)別技術(shù)對所有的音頻信號(hào)均使用同一套通用的音頻信號(hào)識(shí)別模型進(jìn)行識(shí)別。然而,不同的音頻信號(hào)的聲學(xué)特征存在一定的差異,這種音頻信號(hào)識(shí)別技術(shù)的識(shí)別準(zhǔn)確率有待提高。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例提供了一種音頻信號(hào)識(shí)別方法、裝置、設(shè)備、系統(tǒng)和存儲(chǔ)介質(zhì),能夠提高音頻信號(hào)的識(shí)別準(zhǔn)確率。
根據(jù)本發(fā)明實(shí)施例的一方面,提供一種音頻信號(hào)識(shí)別方法,包括:
針對接收的音頻信號(hào),確定音頻信號(hào)中是否包括特定音頻信號(hào);如果音頻信號(hào)中包括特定音頻信號(hào),基于語音識(shí)別模型組件處理音頻信號(hào),得到音頻信號(hào)中語音識(shí)別單元的識(shí)別概率,語音識(shí)別模型組件包括特定聲學(xué)模型和非特定聲學(xué)模型;利用語言模型對音頻信號(hào)中語音識(shí)別單元的識(shí)別概率進(jìn)行聲學(xué)解碼,得到音頻信號(hào)的文本識(shí)別結(jié)果。
根據(jù)本發(fā)明實(shí)施例的另一方面,提供一種音頻信號(hào)識(shí)別裝置,包括:
目標(biāo)音頻判斷模塊,用于判斷接收的音頻信號(hào)的聲學(xué)特征中是否包括目標(biāo)音頻信號(hào)的聲學(xué)特征;目標(biāo)音頻聲學(xué)特征識(shí)別模塊,用于接收的音頻信號(hào)的聲學(xué)特征中包括目標(biāo)音頻信號(hào)的聲學(xué)特征,則采用預(yù)設(shè)目標(biāo)音頻聲學(xué)模型識(shí)別接收的音頻信號(hào)的聲學(xué)特征;通用聲學(xué)特征識(shí)別模塊,用于接收的音頻信號(hào)的聲學(xué)特征中未包括目標(biāo)音頻信號(hào)的聲學(xué)特征,則采用預(yù)設(shè)通用聲學(xué)模型識(shí)別接收的音頻信號(hào)的聲學(xué)特征。
根據(jù)本發(fā)明實(shí)施例的再一方面,提供一種音頻信號(hào)識(shí)別系統(tǒng),包括:
集音設(shè)備,用于接收音頻信號(hào);音頻信號(hào)識(shí)別設(shè)備,用于針對接收的音頻信號(hào),確定音頻信號(hào)中是否包括特定音頻信號(hào),如果音頻信號(hào)中包括特定音頻信號(hào),基于語音識(shí)別模型組件處理音頻信號(hào),得到音頻信號(hào)中語音識(shí)別單元的識(shí)別概率,語音識(shí)別模型組件包括特定聲學(xué)模型和非特定聲學(xué)模型,利用語言模型對音頻信號(hào)中語音識(shí)別單元的識(shí)別概率進(jìn)行聲學(xué)解碼,得到音頻信號(hào)的文本識(shí)別結(jié)果。
根據(jù)本發(fā)明實(shí)施例的又一方面,提供一種音頻信號(hào)識(shí)別設(shè)備,包括:存儲(chǔ)器和處理器;該存儲(chǔ)器用于存儲(chǔ)程序;該處理器用于讀取存儲(chǔ)器中存儲(chǔ)的可執(zhí)行程序代碼以執(zhí)行上述的音頻信號(hào)識(shí)別方法。
根據(jù)本發(fā)明實(shí)施例的還一方面,提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),該計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中存儲(chǔ)有指令,當(dāng)指令在計(jì)算機(jī)上運(yùn)行時(shí),使得計(jì)算機(jī)執(zhí)行上述各方面的音頻信號(hào)識(shí)別方法。
根據(jù)本發(fā)明實(shí)施例中的音頻信號(hào)識(shí)別方法、裝置、設(shè)備、系統(tǒng)和存儲(chǔ)介質(zhì),可以在確定接收的音頻信號(hào)的聲學(xué)特征包括特定音頻信號(hào)的聲學(xué)特征時(shí),語音信號(hào)識(shí)別模型組件利用特定聲學(xué)模型和非特定聲學(xué)模型,對接收的音頻信號(hào)的聲學(xué)特征進(jìn)行識(shí)別,提高音頻信號(hào)識(shí)別準(zhǔn)確率。
附圖說明
從下面結(jié)合附圖對本發(fā)明的具體實(shí)施方式的描述中可以更好地理解本發(fā)明其中,相同或相似的附圖標(biāo)記表示相同或相似的特征。
圖1示出了根據(jù)本發(fā)明示例性實(shí)施例的音頻信號(hào)識(shí)別系統(tǒng)的實(shí)際應(yīng)用場景;
圖2示出了本發(fā)明一實(shí)施例的音頻信號(hào)的識(shí)別系統(tǒng)的結(jié)構(gòu)示意圖;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于阿里巴巴集團(tuán)控股有限公司,未經(jīng)阿里巴巴集團(tuán)控股有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811148191.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 自動(dòng)配置藍(lán)牙A2DP傳輸音頻編碼格式的方法和系統(tǒng)
- 一種多路音頻處理方法、音頻播放終端及音頻接收裝置
- 一種音頻處理方法、裝置及終端設(shè)備
- 一種音頻質(zhì)量的檢測方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 音頻分離方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種音頻播放方法、裝置、以及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 一種音頻錄制系統(tǒng)
- 一種音頻共享系統(tǒng)及方法
- 音頻樣本生成方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 音頻處理方法和裝置
- 信號(hào)調(diào)制方法、信號(hào)調(diào)制裝置、信號(hào)解調(diào)方法和信號(hào)解調(diào)裝置
- 亮度信號(hào)/色信號(hào)分離裝置和亮度信號(hào)/色信號(hào)分離方法
- 信號(hào)調(diào)制方法、信號(hào)調(diào)制裝置、信號(hào)解調(diào)方法和信號(hào)解調(diào)裝置
- 信號(hào)調(diào)制方法、信號(hào)調(diào)制裝置、信號(hào)解調(diào)方法和信號(hào)解調(diào)裝置
- 雙耳信號(hào)的信號(hào)生成
- 雙耳信號(hào)的信號(hào)生成
- 信號(hào)處理裝置、信號(hào)處理方法、信號(hào)處理程序
- USBTYPEC信號(hào)轉(zhuǎn)HDMI信號(hào)的信號(hào)轉(zhuǎn)換線
- 信號(hào)盒(信號(hào)轉(zhuǎn)換)
- 信號(hào)調(diào)制方法、信號(hào)調(diào)制裝置、信號(hào)解調(diào)方法和信號(hào)解調(diào)裝置
- 識(shí)別媒體、識(shí)別媒體的識(shí)別方法、識(shí)別對象物品以及識(shí)別裝置
- 一種探針卡識(shí)別裝置和方法
- 識(shí)別裝置、識(shí)別方法以及記錄介質(zhì)
- 識(shí)別裝置、識(shí)別系統(tǒng),識(shí)別方法以及存儲(chǔ)介質(zhì)
- 識(shí)別程序、識(shí)別方法以及識(shí)別裝置
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 識(shí)別裝置、識(shí)別方法以及識(shí)別程序
- 識(shí)別裝置、識(shí)別方法及識(shí)別程序
- 一種數(shù)據(jù)庫讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測試終端的測試方法
- 一種服裝用人體測量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





