[發(fā)明專利]音頻信號(hào)的處理方法、裝置、介質(zhì)和音頻交互設(shè)備有效
| 申請(qǐng)?zhí)枺?/td> | 201910741369.0 | 申請(qǐng)日: | 2018-11-30 |
| 公開(公告)號(hào): | CN110491403B | 公開(公告)日: | 2022-03-04 |
| 發(fā)明(設(shè)計(jì))人: | 鄭脊萌;劉二男;高毅;黎韋偉 | 申請(qǐng)(專利權(quán))人: | 騰訊科技(深圳)有限公司 |
| 主分類號(hào): | G10L21/0208 | 分類號(hào): | G10L21/0208;G10L21/0216;G10L21/0224;G10L21/0232;G10L25/51;G01S3/802 |
| 代理公司: | 深圳市隆天聯(lián)鼎知識(shí)產(chǎn)權(quán)代理有限公司 44232 | 代理人: | 王鵬健 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 音頻 信號(hào) 處理 方法 裝置 介質(zhì) 交互 設(shè)備 | ||
1.一種音頻信號(hào)的處理方法,其特征在于,所述方法包括:
獲取音頻交互設(shè)備上的麥克風(fēng)采樣得到的音頻信號(hào),所述音頻信號(hào)中包含目標(biāo)音頻直射信號(hào);
在所述音頻交互設(shè)備中獲取回聲參考信號(hào),通過所述回聲參考信號(hào)對(duì)所述麥克風(fēng)采集的所述音頻信號(hào)進(jìn)行線性回聲消除;
在所述音頻信號(hào)消回聲之后進(jìn)行時(shí)頻分析,獲得消回聲后音頻信號(hào)的時(shí)頻域表達(dá);
對(duì)所述消回聲后音頻信號(hào)的時(shí)頻域表達(dá),按照時(shí)頻點(diǎn)進(jìn)行音頻特征參數(shù)的估計(jì),所述音頻特征參數(shù)為多種;
獲取所述消回聲后音頻信號(hào)的時(shí)頻域表達(dá)在時(shí)頻點(diǎn)上的不同音頻特征參數(shù)分別映射的權(quán)值,根據(jù)所述權(quán)值進(jìn)行加權(quán)計(jì)算,獲得所述消回聲后音頻信號(hào)在所述時(shí)頻點(diǎn)的權(quán)值;
通過所述時(shí)頻點(diǎn)的權(quán)值和所述時(shí)頻域表達(dá),獲取對(duì)應(yīng)于所述時(shí)頻點(diǎn)的加權(quán)協(xié)方差矩陣,所述加權(quán)協(xié)方差矩陣用于描述音頻信號(hào)中所述目標(biāo)音頻直射信號(hào)的相對(duì)比重;
通過所述加權(quán)協(xié)方差矩陣進(jìn)行空間譜的加權(quán)運(yùn)算,獲得所述音頻信號(hào)按照時(shí)頻點(diǎn)經(jīng)過加權(quán)的空間譜;
由所述空間譜獲得所述音頻信號(hào)中目標(biāo)音頻直射信號(hào)對(duì)應(yīng)的聲源方位角。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述音頻特征參數(shù)包括所述時(shí)頻域表達(dá)在時(shí)頻點(diǎn)的信噪比估計(jì)值,所述對(duì)所述消回聲后音頻信號(hào)的時(shí)頻域表達(dá),按照時(shí)頻點(diǎn)進(jìn)行音頻特征參數(shù)的估計(jì),包括:
對(duì)所述消回聲后音頻信號(hào)的時(shí)頻域表達(dá)估計(jì)每一個(gè)時(shí)頻點(diǎn)的信噪比估計(jì)值,所述信噪比估計(jì)值用于映射得到所述消回聲后音頻信號(hào)在時(shí)頻點(diǎn)的權(quán)值。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述音頻特征參數(shù)還包括時(shí)頻域表達(dá)在時(shí)頻點(diǎn)上的直射對(duì)混響信號(hào)強(qiáng)度比、殘留回聲信號(hào)估計(jì)值以及所述時(shí)頻點(diǎn)對(duì)應(yīng)于目標(biāo)喚醒詞的概率中至少一種或者任意組合。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述音頻特征參數(shù)包括所述時(shí)頻點(diǎn)對(duì)應(yīng)于目標(biāo)喚醒詞概率,所述對(duì)所述消回聲后音頻信號(hào)的時(shí)頻域表達(dá),按照時(shí)頻點(diǎn)進(jìn)行音頻特征參數(shù)的估計(jì),包括:
檢測(cè)所述消回聲后音頻信號(hào)中的目標(biāo)喚醒詞,對(duì)檢測(cè)的所述目標(biāo)喚醒詞估計(jì)所在的時(shí)頻點(diǎn),獲得每一時(shí)頻點(diǎn)對(duì)應(yīng)于目標(biāo)喚醒詞的概率。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述通過所述時(shí)頻點(diǎn)的權(quán)值和所述時(shí)頻域表達(dá),獲取對(duì)應(yīng)于所述時(shí)頻點(diǎn)的加權(quán)協(xié)方差矩陣,包括:
在時(shí)頻點(diǎn)上通過所述音頻信號(hào)的時(shí)頻域表達(dá)和權(quán)值,進(jìn)行加權(quán)運(yùn)算得到所述時(shí)頻點(diǎn)在所述加權(quán)協(xié)方差矩陣對(duì)應(yīng)的加權(quán)元素值,所有時(shí)頻點(diǎn)對(duì)應(yīng)的加權(quán)元素值構(gòu)成所述加權(quán)協(xié)方差矩陣。
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,在所述音頻信號(hào)消回聲之后進(jìn)行時(shí)頻分析,包括:
通過短時(shí)傅里葉變換對(duì)所述消回聲后音頻信號(hào)進(jìn)行時(shí)頻分析。
7.一種音頻信號(hào)的處理裝置,其特征在于,所述裝置包括:
信號(hào)獲取模塊,用于獲取音頻交互設(shè)備上的麥克風(fēng)采樣得到的音頻信號(hào),所述音頻信號(hào)中包含目標(biāo)音頻直射信號(hào);
消回聲模塊,用于在所述音頻交互設(shè)備中獲取回聲參考信號(hào),通過所述回聲參考信號(hào)對(duì)所述麥克風(fēng)采集的所述音頻信號(hào)進(jìn)行線性回聲消除;
時(shí)域分析模塊,用于在所述音頻信號(hào)消回聲之后進(jìn)行時(shí)頻分析,獲得消回聲后音頻信號(hào)的時(shí)頻域表達(dá);
權(quán)值運(yùn)算模塊,用于對(duì)所述消回聲后音頻信號(hào)的時(shí)頻域表達(dá),按照時(shí)頻點(diǎn)進(jìn)行音頻特征參數(shù)的估計(jì),所述音頻特征參數(shù)為多種,根據(jù)對(duì)應(yīng)于所述時(shí)頻點(diǎn)的音頻特征參數(shù)獲得所述音頻信號(hào)在所述時(shí)頻點(diǎn)的權(quán)值;
矩陣運(yùn)算模塊,用于通過所述時(shí)頻點(diǎn)的權(quán)值和所述時(shí)頻域表達(dá),獲取對(duì)應(yīng)于所述時(shí)頻點(diǎn)的加權(quán)協(xié)方差矩陣,所述加權(quán)協(xié)方差矩陣用于描述音頻信號(hào)中所述目標(biāo)音頻直射信號(hào)的相對(duì)比重;
空間譜加權(quán)模塊,用于通過所述加權(quán)協(xié)方差矩陣進(jìn)行空間譜的加權(quán)運(yùn)算,獲得所述音頻信號(hào)按照時(shí)頻點(diǎn)經(jīng)過加權(quán)的空間譜;
方位角定位模塊,用于由所述空間譜獲得所述音頻信號(hào)中目標(biāo)音頻直射信號(hào)對(duì)應(yīng)的聲源方位角。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于騰訊科技(深圳)有限公司,未經(jīng)騰訊科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910741369.0/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 自動(dòng)配置藍(lán)牙A2DP傳輸音頻編碼格式的方法和系統(tǒng)
- 一種多路音頻處理方法、音頻播放終端及音頻接收裝置
- 一種音頻處理方法、裝置及終端設(shè)備
- 一種音頻質(zhì)量的檢測(cè)方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 音頻分離方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種音頻播放方法、裝置、以及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 一種音頻錄制系統(tǒng)
- 一種音頻共享系統(tǒng)及方法
- 音頻樣本生成方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 音頻處理方法和裝置
- 信號(hào)調(diào)制方法、信號(hào)調(diào)制裝置、信號(hào)解調(diào)方法和信號(hào)解調(diào)裝置
- 亮度信號(hào)/色信號(hào)分離裝置和亮度信號(hào)/色信號(hào)分離方法
- 信號(hào)調(diào)制方法、信號(hào)調(diào)制裝置、信號(hào)解調(diào)方法和信號(hào)解調(diào)裝置
- 信號(hào)調(diào)制方法、信號(hào)調(diào)制裝置、信號(hào)解調(diào)方法和信號(hào)解調(diào)裝置
- 雙耳信號(hào)的信號(hào)生成
- 雙耳信號(hào)的信號(hào)生成
- 信號(hào)處理裝置、信號(hào)處理方法、信號(hào)處理程序
- USBTYPEC信號(hào)轉(zhuǎn)HDMI信號(hào)的信號(hào)轉(zhuǎn)換線
- 信號(hào)盒(信號(hào)轉(zhuǎn)換)
- 信號(hào)調(diào)制方法、信號(hào)調(diào)制裝置、信號(hào)解調(diào)方法和信號(hào)解調(diào)裝置
- 一種數(shù)據(jù)庫讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





