[發(fā)明專利]音頻增強方法、裝置、計算機設(shè)備和存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 202310551663.1 | 申請日: | 2023-05-16 |
| 公開(公告)號: | CN116564325A | 公開(公告)日: | 2023-08-08 |
| 發(fā)明(設(shè)計)人: | 徐雪;張馳;江文樂;楊潔瓊 | 申請(專利權(quán))人: | 中國工商銀行股份有限公司 |
| 主分類號: | G10L21/02 | 分類號: | G10L21/02;G10L25/30 |
| 代理公司: | 華進聯(lián)合專利商標(biāo)代理有限公司 44224 | 代理人: | 姚姝婭 |
| 地址: | 100140 北*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 音頻 增強 方法 裝置 計算機 設(shè)備 存儲 介質(zhì) | ||
本申請涉及一種音頻增強方法、裝置、計算機設(shè)備、存儲介質(zhì)和計算機程序產(chǎn)品,可用于音頻處理技術(shù)領(lǐng)域,也可用于金融科技領(lǐng)域或其他相關(guān)領(lǐng)域。該方法包括:對金融系統(tǒng)的待處理音頻進行分割處理,得到待處理音頻的多個音頻片段;獲取每個音頻片段與每個音頻片段的參考音頻片段之間的對齊特征,將每個音頻片段的初始音頻特征和對齊特征進行融合處理,得到每個音頻片段的融合特征;對每個音頻片段的融合特征進行特征提取處理,得到每個音頻片段的目標(biāo)音頻特征;將每個音頻片段的目標(biāo)音頻特征添加到每個音頻片段上,得到每個音頻片段的增強音頻片段;將每個音頻片段的增強音頻片段進行組合,得到增強音頻。采用本方法能夠提高音頻增強效果。
技術(shù)領(lǐng)域
本申請涉及音頻處理技術(shù)領(lǐng)域,特別是涉及一種音頻增強方法、裝置、計算機設(shè)備、存儲介質(zhì)和計算機程序產(chǎn)品。
背景技術(shù)
在金融業(yè)務(wù)場景中,有時候需要對金融系統(tǒng)的音頻進行審核,比如貸款面簽過程中的音頻。為了方便進行音頻審核,需要對金融系統(tǒng)的音頻進行音頻增強處理,避免音頻質(zhì)量較差,影響音頻審核結(jié)果。
傳統(tǒng)技術(shù)中,對金融系統(tǒng)的音頻進行增強時,主要是通過濾波的方式對音頻進行增強。但是,僅僅通過濾波方式對音頻進行增強,容易遺漏音頻的關(guān)鍵信息,導(dǎo)致音頻增強效果較差。
發(fā)明內(nèi)容
基于此,有必要針對上述技術(shù)問題,提供一種能夠提高音頻增強效果的音頻增強方法、裝置、計算機設(shè)備、計算機可讀存儲介質(zhì)和計算機程序產(chǎn)品。
第一方面,本申請?zhí)峁┝艘环N音頻增強方法。所述方法包括:
對金融系統(tǒng)的待處理音頻進行分割處理,得到所述待處理音頻的多個音頻片段;
獲取每個音頻片段與所述每個音頻片段的參考音頻片段之間的對齊特征,將所述每個音頻片段的初始音頻特征和對齊特征進行融合處理,得到所述每個音頻片段的融合特征;
對所述每個音頻片段的融合特征進行特征提取處理,得到所述每個音頻片段的目標(biāo)音頻特征;
將所述每個音頻片段的目標(biāo)音頻特征添加到所述每個音頻片段上,得到所述每個音頻片段的增強音頻片段;
將所述每個音頻片段的增強音頻片段進行組合,得到所述待處理音頻的增強音頻。
在其中一個實施例中,所述獲取每個音頻片段與所述每個音頻片段的參考音頻片段之間的對齊特征,將所述每個音頻片段的初始音頻特征和對齊特征進行融合處理,得到所述每個音頻片段的融合特征,包括:
將每個音頻片段與所述每個音頻片段的參考音頻片段,輸入預(yù)先訓(xùn)練的音頻增強模型中的可變形卷積層中進行可變形卷積處理,得到所述每個音頻片段與所述每個音頻片段的參考音頻片段之間的對齊特征;
對所述每個音頻片段的初始音頻特征和對齊特征進行拼接處理,得到所述每個音頻片段的拼接特征,作為所述每個音頻片段的融合特征。
在其中一個實施例中,所述預(yù)先訓(xùn)練的音頻增強模型還包括依次連接的第一特征提取層、第二特征提取層和第三特征提取層,所述第一特征提取層包括第一卷積層,所述第二特征提取層包括依次連接的第二卷積層、第一密集塊、第二密集塊、第三密集塊、拼接層、第三卷積層和第四卷積層,所述第一密集塊和所述第二密集塊還與所述拼接層連接,所述第三特征提取層包括依次連接的第五卷積層、殘差層、第六卷積層和重建層;
所述對所述每個音頻片段的融合特征進行特征提取處理,得到所述每個音頻片段的目標(biāo)音頻特征,包括:
將所述每個音頻片段的融合特征輸入所述第一特征提取層中進行卷積處理,得到所述每個音頻片段的第一音頻特征;
將所述每個音頻片段的第一音頻特征輸入所述第二特征提取層中進行多次特征提取處理,得到所述每個音頻片段的第二音頻特征;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國工商銀行股份有限公司,未經(jīng)中國工商銀行股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310551663.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





