[發(fā)明專利]一種音頻處理方法、設(shè)備及具有存儲(chǔ)功能的裝置在審
| 申請(qǐng)?zhí)枺?/td> | 201910673556.X | 申請(qǐng)日: | 2019-07-24 |
| 公開(公告)號(hào): | CN110580914A | 公開(公告)日: | 2019-12-17 |
| 發(fā)明(設(shè)計(jì))人: | 鄭占磊;熊磊 | 申請(qǐng)(專利權(quán))人: | 安克創(chuàng)新科技股份有限公司 |
| 主分類號(hào): | G10L25/18 | 分類號(hào): | G10L25/18;G10L21/003 |
| 代理公司: | 44280 深圳市威世博知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人: | 李慶波 |
| 地址: | 410000 湖南省長(zhǎng)沙市長(zhǎng)沙高新開發(fā)區(qū)*** | 國(guó)省代碼: | 湖南;43 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 頻譜特征 音頻文件 音頻信號(hào) 預(yù)設(shè) 存儲(chǔ)功能 頻譜分析 音頻處理 真實(shí)度 音質(zhì) 申請(qǐng) 匹配 削弱 | ||
1.一種音頻處理方法,其特征在于,包括:
獲取音頻文件;
對(duì)所述音頻文件進(jìn)行頻譜分析得到至少一個(gè)頻譜特征,以在所述音頻文件中識(shí)別出所述至少一個(gè)頻譜特征對(duì)應(yīng)的預(yù)設(shè)音頻信號(hào);
對(duì)所述預(yù)設(shè)音頻信號(hào)進(jìn)行與其頻譜特征相匹配的處理,以實(shí)現(xiàn)所述預(yù)設(shè)音頻信號(hào)的增強(qiáng)或削弱。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對(duì)所述音頻文件進(jìn)行頻譜分析得到至少一個(gè)頻譜特征,以在所述音頻文件中識(shí)別出所述至少一個(gè)頻譜特征對(duì)應(yīng)的預(yù)設(shè)音頻信號(hào)包括:
通過所述預(yù)設(shè)音頻信號(hào)對(duì)應(yīng)的頻譜特征識(shí)別出與所述頻譜特征相匹配的聲音類型;
所述對(duì)所述預(yù)設(shè)音頻信號(hào)進(jìn)行與其頻譜特征相匹配的處理包括:
獲取與所述預(yù)設(shè)音頻信號(hào)所屬的聲音類型相匹配的音頻調(diào)整參數(shù);
按所述音頻調(diào)整參數(shù)對(duì)所述預(yù)設(shè)音頻信號(hào)進(jìn)行相對(duì)應(yīng)的音頻處理。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述通過所述預(yù)設(shè)音頻信號(hào)對(duì)應(yīng)的頻譜特征識(shí)別出與所述頻譜特征相匹配的聲音類型包括:
將所述音頻文件輸入聲音識(shí)別模型中,以識(shí)別出與所述預(yù)設(shè)音頻信號(hào)所屬的聲音類型對(duì)應(yīng)的類型標(biāo)簽;其中,在所述聲音識(shí)別模型中,相同的所述聲音類型對(duì)應(yīng)至少一個(gè)所述類型標(biāo)簽,不同的所述聲音類型對(duì)應(yīng)不同的所述類型標(biāo)簽。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述獲取與所述預(yù)設(shè)音頻信號(hào)所屬的聲音類型相匹配的音頻調(diào)整參數(shù)包括:
獲取與所述類型標(biāo)簽匹配的所述音頻調(diào)整參數(shù);
所述按所述音頻調(diào)整參數(shù)對(duì)所述預(yù)設(shè)音頻信號(hào)進(jìn)行相對(duì)應(yīng)的音頻處理包括:
利用數(shù)字信號(hào)處理器和/或現(xiàn)場(chǎng)可編程門陣列按所述音頻調(diào)整參數(shù)對(duì)所述預(yù)設(shè)音頻信號(hào)進(jìn)行音頻處理。
5.根據(jù)權(quán)利要求3或4所述的方法,其特征在于,所述獲取音頻文件之前,包括:
錄制多個(gè)音頻樣本文件,所述音頻樣本文件包括多個(gè)所述音頻文件所述音頻文件中包括多種聲音類型;
對(duì)所述多個(gè)音頻樣本文件進(jìn)行頻譜分析,以得到每種所述聲音類型對(duì)應(yīng)的頻譜特征,并根據(jù)所述頻譜特征設(shè)置對(duì)應(yīng)的所述音頻調(diào)整參數(shù),將所述音頻調(diào)整參數(shù)存入均衡器或數(shù)字信號(hào)處理器中;或者,
利用所述多個(gè)音頻樣本文件訓(xùn)練聲音識(shí)別模型,以使得所述聲音識(shí)別模型用于區(qū)分不同聲音類型的音頻信號(hào),并將訓(xùn)練好的所述聲音識(shí)別模型寫入微處理器或現(xiàn)場(chǎng)可編程門陣列中。
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,
所述在所述音頻文件中識(shí)別出所述至少一個(gè)頻譜特征對(duì)應(yīng)的預(yù)設(shè)音頻信號(hào)之后進(jìn)一步包括:
識(shí)別所述預(yù)設(shè)音頻信號(hào)的左右聲道信號(hào);
利用數(shù)字信號(hào)處理器和/或現(xiàn)場(chǎng)可編程門陣列對(duì)所述左右聲道信號(hào)中的至少一者進(jìn)行增強(qiáng)或者削弱處理;或者,
將所述左右聲道信號(hào)進(jìn)行比較,得到所述左右聲道信號(hào)之間的區(qū)別大于預(yù)設(shè)信號(hào)范圍的音頻區(qū)域,并對(duì)所述音頻區(qū)域進(jìn)行增強(qiáng)處理。
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,
所述在所述音頻文件中識(shí)別出所述至少一個(gè)頻譜特征對(duì)應(yīng)的預(yù)設(shè)音頻信號(hào)之后包括:
對(duì)所述預(yù)設(shè)音頻信號(hào)進(jìn)行環(huán)繞聲識(shí)別處理,以識(shí)別出所述預(yù)設(shè)音頻信號(hào)的各方位音頻信號(hào);
對(duì)所述各方位音頻信號(hào)中的至少一個(gè)方位音頻信號(hào)進(jìn)行增強(qiáng)或削弱處理。
8.根據(jù)權(quán)利要求1所述的方法,其特征在于,
對(duì)所述預(yù)設(shè)音頻信號(hào)進(jìn)行與其頻譜特征相匹配的處理,以實(shí)現(xiàn)所述預(yù)設(shè)音頻信號(hào)的增強(qiáng)或削弱包括:
獲取與當(dāng)前用戶相匹配的音頻調(diào)整模型,其中所述音頻調(diào)整模型是按所述當(dāng)前用戶預(yù)設(shè)的音頻處理方式預(yù)先訓(xùn)練好的深度學(xué)習(xí)或機(jī)器學(xué)習(xí)模型;
在所述音頻調(diào)整模型中識(shí)別出與所述預(yù)設(shè)音頻信號(hào)的頻譜特征相匹配的處理方式,按所述處理方式對(duì)所述預(yù)設(shè)音頻信號(hào)進(jìn)行增強(qiáng)或削弱處理。
9.一種音頻處理設(shè)備,其特征在于,包括:相互連接的音頻獲取裝置和處理器;
所述音頻獲取裝置用于獲取音頻文件;
所述處理器用于執(zhí)行指令以實(shí)現(xiàn)如權(quán)利要求1-8任一項(xiàng)所述的方法。
10.一種具有存儲(chǔ)功能的裝置,內(nèi)部存儲(chǔ)有程序指令,其特征在于,所述程序指令被執(zhí)行以實(shí)現(xiàn)如權(quán)利要求1-8任一項(xiàng)所述的方法。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于安克創(chuàng)新科技股份有限公司,未經(jīng)安克創(chuàng)新科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910673556.X/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 一種濾線柵偽影檢測(cè)及抑制方法及其裝置
- 一種認(rèn)知無線電系統(tǒng)中的頻譜感知方法和系統(tǒng)
- 一種基于頻譜特征的被試品電磁發(fā)射幅度頻譜數(shù)據(jù)進(jìn)行分類的方法
- 脈沖光束頻譜特征控制
- 一種噪音消除方法、裝置、系統(tǒng)、設(shè)備及存儲(chǔ)介質(zhì)
- 一種寬帶頻譜序列的干擾信號(hào)的識(shí)別與統(tǒng)計(jì)方法
- 脈沖光束頻譜特征控制
- 語音合成方法、裝置、計(jì)算機(jī)設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 語音分離方法、系統(tǒng)、移動(dòng)終端及存儲(chǔ)介質(zhì)
- 頻譜預(yù)測(cè)方法和裝置
- 音頻裝置
- 一種多聲道/高保真可視電話
- 一種音頻信號(hào)接收、轉(zhuǎn)接裝置和音頻信號(hào)傳輸系統(tǒng)
- 一種音頻信號(hào)轉(zhuǎn)接裝置、音頻信號(hào)傳輸系統(tǒng)
- 帶直錄功能的音頻信號(hào)發(fā)生器
- 音頻信號(hào)處理裝置
- 用于改進(jìn)從隱藏音頻信號(hào)部分的轉(zhuǎn)換的裝置和方法
- 一種音頻信號(hào)的自動(dòng)切換方法及音頻設(shè)備
- 一種音頻信號(hào)處理方法、裝置、系統(tǒng)以及電子設(shè)備
- 一種音頻信號(hào)處理方法及裝置、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)





