[發(fā)明專利]音頻處理方法、裝置、電子設(shè)備及可讀存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 202111151964.2 | 申請日: | 2021-09-29 |
| 公開(公告)號: | CN113870867A | 公開(公告)日: | 2021-12-31 |
| 發(fā)明(設(shè)計)人: | 孫連鵬;馮大航;陳孝良 | 申請(專利權(quán))人: | 北京聲智科技有限公司 |
| 主分類號: | G10L17/20 | 分類號: | G10L17/20;G10L21/02 |
| 代理公司: | 北京銀龍知識產(chǎn)權(quán)代理有限公司 11243 | 代理人: | 歐文芳 |
| 地址: | 100094 北京市海淀*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 音頻 處理 方法 裝置 電子設(shè)備 可讀 存儲 介質(zhì) | ||
本申請公開了一種音頻處理方法、裝置、電子設(shè)備及可讀存儲介質(zhì),屬于音頻處理技術(shù)領(lǐng)域。其中,由終端執(zhí)行的方法包括:獲取第一人聲音頻和環(huán)境聲音頻;根據(jù)所述第一人聲音頻的信息量、所述環(huán)境聲音頻的信息量和所述終端的算力狀態(tài),確定是否向云端服務(wù)器發(fā)送所述第一人聲音頻和所述環(huán)境聲音頻,以及音頻處理請求,所述音頻處理請求用于請求所述云端服務(wù)器對所述第一人聲音頻和所述環(huán)境聲音頻進行降噪處理,以獲取所述第一人聲音頻對應(yīng)的目標聲紋信息。能夠使終端及時進行降噪處理,提高聲紋識別的效率。
技術(shù)領(lǐng)域
本申請屬于音頻處理技術(shù)領(lǐng)域,具體涉及一種音頻處理方法、裝置、電子設(shè)備及可讀存儲介質(zhì)。
背景技術(shù)
隨著智能語音技術(shù)不斷進步,聲紋應(yīng)用顯現(xiàn)出巨大的潛力。一方面,比對運算能力和算法精度的顯著提升,能夠支撐開展海量聲紋數(shù)據(jù)的比對串并,另一方面,海量語音下聲紋建模、關(guān)鍵詞檢索等算法能力的擴展,能夠?qū)崿F(xiàn)海量篩查、快速預(yù)警等功能。
目前,針對目標對象的聲音采集通常是在較為嘈雜的環(huán)境中進行,為了提高聲紋識別的準確性,通常需要采集信息量較大的原始音頻,使得一些低算力設(shè)備無法及時完成聲紋識別,聲紋識別的效率較低。
發(fā)明內(nèi)容
本申請實施例的目的是提供一種音頻處理方法、裝置、電子設(shè)備及可讀存儲介質(zhì),能夠解決音頻處理效率較低的問題。
第一方面,本申請實施例提供了一種音頻處理方法,由終端執(zhí)行,所述方法包括:
獲取第一人聲音頻和環(huán)境聲音頻;
根據(jù)所述第一人聲音頻的信息量、所述環(huán)境聲音頻的信息量和所述終端的算力狀態(tài),確定是否向云端服務(wù)器發(fā)送所述第一人聲音頻和所述環(huán)境聲音頻,以及音頻處理請求,所述音頻處理請求用于請求所述云端服務(wù)器對所述第一人聲音頻和所述環(huán)境聲音頻進行降噪處理,以獲取所述第一人聲音頻對應(yīng)的目標聲紋信息。
第二方面,本申請實施例提供了一種音頻處理方法,由云端服務(wù)器執(zhí)行,所述方法包括:
執(zhí)行第一操作,所述第一操作包括以下任意一項:
接收終端發(fā)送的第一人聲音頻和環(huán)境聲音頻,以及音頻處理請求,所述音頻處理請求用于請求所述云端服務(wù)器對所述第一人聲音頻和所述環(huán)境聲音頻進行降噪處理,以獲取所述第一人聲音頻對應(yīng)的目標聲紋信息;
接收所述終端發(fā)送的所述目標聲紋信息。
第三方面,本申請實施例提供了一種音頻處理裝置,包括:
獲取模塊,用于獲取第一人聲音頻和環(huán)境聲音頻;
確定模塊,用于根據(jù)所述第一人聲音頻的信息量、所述環(huán)境聲音頻的信息量和所述裝置的算力狀態(tài),確定是否向云端服務(wù)器發(fā)送所述第一人聲音頻和所述環(huán)境聲音頻,以及音頻處理請求,所述音頻處理請求用于請求所述云端服務(wù)器對所述第一人聲音頻和所述環(huán)境聲音頻進行降噪處理,以獲取所述第一人聲音頻對應(yīng)的目標聲紋信息。
第四方面,本申請實施例提供了一種音頻處理裝置,包括:
執(zhí)行模塊,用于執(zhí)行第一操作,所述第一操作包括以下任意一項:
接收終端發(fā)送的第一人聲音頻和環(huán)境聲音頻,以及音頻處理請求,所述音頻處理請求用于請求所述裝置對所述第一人聲音頻和所述環(huán)境聲音頻進行降噪處理,以獲取所述第一人聲音頻對應(yīng)的目標聲紋信息;
接收所述終端發(fā)送的所述目標聲紋信息。
第五方面,本申請實施例提供了一種電子設(shè)備,該電子設(shè)備包括處理器、存儲器及存儲在所述存儲器上并可在所述處理器上運行的程序或指令,所述程序或指令被所述處理器執(zhí)行時實現(xiàn)如第一方面或第二方面所述的方法的步驟。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京聲智科技有限公司,未經(jīng)北京聲智科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111151964.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





