[發(fā)明專利]一種音頻檢測方法、裝置及存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 201810191720.9 | 申請日: | 2018-03-08 |
| 公開(公告)號: | CN108470571B | 公開(公告)日: | 2020-09-08 |
| 發(fā)明(設(shè)計(jì))人: | 陳洲旋 | 申請(專利權(quán))人: | 騰訊音樂娛樂科技(深圳)有限公司 |
| 主分類號: | G10L25/78 | 分類號: | G10L25/78;G10L25/87 |
| 代理公司: | 深圳翼盛智成知識產(chǎn)權(quán)事務(wù)所(普通合伙) 44300 | 代理人: | 黃威 |
| 地址: | 518000 廣東省深圳市*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 音頻 檢測 方法 裝置 存儲 介質(zhì) | ||
本發(fā)明實(shí)施例公開了一種音頻檢測方法、裝置及存儲介質(zhì),本發(fā)明實(shí)施例通過獲取待檢測音頻中每個(gè)音頻幀的最大值及最小值;確定目標(biāo)音頻幀,該目標(biāo)音頻為最大值及最小值之間的差值小于第一閾值的音頻幀;若目標(biāo)音頻幀不是靜音數(shù)據(jù),獲取目標(biāo)音頻幀中頻率小于預(yù)設(shè)頻率的能量值,及該能量值占目標(biāo)音頻幀的總能量值的比重;當(dāng)該比重大于第一預(yù)設(shè)能量閾值時(shí),確定目標(biāo)音頻幀為音頻斷點(diǎn)。該方案中可以通過每個(gè)音頻幀對應(yīng)的最大值及最小值、目標(biāo)音頻幀的頻域小于預(yù)設(shè)頻率的能量值、及目標(biāo)音頻幀的總能量值等信息,能夠?qū)σ纛l斷點(diǎn)所在的音頻幀進(jìn)行準(zhǔn)確判定,避免了人為主觀因素的影響,提高了對音頻檢測的準(zhǔn)確性。
技術(shù)領(lǐng)域
本發(fā)明涉及數(shù)據(jù)處理技術(shù)領(lǐng)域,具體涉及一種音頻檢測方法、裝置及存儲介質(zhì)。
背景技術(shù)
隨著互聯(lián)網(wǎng)的發(fā)展,以及數(shù)字音頻迅速流行,對于黑膠、磁帶及光盤等載體,在音頻從模擬信號轉(zhuǎn)到數(shù)字信號的轉(zhuǎn)錄過程中,由于載體損壞等各種原因,會導(dǎo)致音頻在錄制的過程中產(chǎn)生一些缺陷。另外,音頻在通過互聯(lián)網(wǎng)傳播的過程中,也可能產(chǎn)生錯(cuò)誤,而引入一些缺陷。在這些缺陷中,斷點(diǎn)是其中的一類,該斷點(diǎn)會導(dǎo)致音頻播放的聲音斷斷續(xù)續(xù),或者是聲音丟失,因此,可以對音頻進(jìn)行斷點(diǎn)檢測,以便對存在的斷點(diǎn)進(jìn)行修復(fù)。
現(xiàn)有技術(shù)中,在對音頻中的斷點(diǎn)進(jìn)行檢測時(shí),一般是通過人為的聽覺對音頻進(jìn)行試聽,主觀判定是否存在斷點(diǎn),當(dāng)存在斷點(diǎn)時(shí),判定斷點(diǎn)存在的大概位置。由于人為主觀因素的影響,可能會產(chǎn)生較大的偏差,因此,通過該檢測方法對音頻進(jìn)行斷點(diǎn)檢測,得到的檢測結(jié)果的準(zhǔn)確性較低。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例提供一種音頻檢測方法、裝置及存儲介質(zhì),旨在提高對音頻檢測的準(zhǔn)確性。
為解決上述技術(shù)問題,本發(fā)明實(shí)施例提供以下技術(shù)方案:
一種音頻檢測方法,包括:
獲取待檢測音頻中每個(gè)音頻幀的最大值及最小值;
確定目標(biāo)音頻幀,所述目標(biāo)音頻為所述最大值及所述最小值之間的差值小于第一閾值的音頻幀;
若所述目標(biāo)音頻幀不是靜音數(shù)據(jù),獲取所述目標(biāo)音頻幀中頻率小于預(yù)設(shè)頻率的能量值,及所述能量值占所述目標(biāo)音頻幀的總能量值的比重;
若所述比重大于第一預(yù)設(shè)能量閾值,則確定所述目標(biāo)音頻幀為音頻斷點(diǎn)。
一種音頻檢測裝置,包括:
取值獲取單元,用于獲取待檢測音頻中每個(gè)音頻幀的最大值及最小值;
音頻幀獲取單元,用于確定目標(biāo)音頻幀,所述目標(biāo)音頻為所述最大值及所述最小值之間的差值小于第一閾值的音頻幀;
比重獲取單元,用于若所述目標(biāo)音頻幀不是靜音數(shù)據(jù),獲取所述目標(biāo)音頻幀中頻率小于預(yù)設(shè)頻率的能量值,及所述能量值占所述目標(biāo)音頻幀的總能量值的比重;
第一確定單元,用于若所述比重大于第一預(yù)設(shè)能量閾值,則確定所述目標(biāo)音頻幀為音頻斷點(diǎn)。
一種存儲介質(zhì),所述存儲介質(zhì)存儲有多條指令,所述指令適于處理器進(jìn)行加載,以執(zhí)行上述音頻檢測方法中的步驟。
本發(fā)明實(shí)施例通過獲取待檢測音頻中每個(gè)音頻幀的最大值及最小值,以及確定目標(biāo)音頻幀,該目標(biāo)音頻為最大值及最小值之間的差值小于第一閾值的音頻幀,該目標(biāo)音頻幀的變化幅度比較平緩。然后,進(jìn)一步對目標(biāo)音頻幀進(jìn)行分析,若目標(biāo)音頻幀不是靜音數(shù)據(jù),獲取目標(biāo)音頻幀中頻率小于預(yù)設(shè)頻率的能量值,及該能量值占目標(biāo)音頻幀的總能量值的比重;當(dāng)該比重大于第一預(yù)設(shè)能量閾值時(shí),說明目標(biāo)音頻幀能量值變化不大,此時(shí)確定目標(biāo)音頻幀為音頻斷點(diǎn)。該方案中可以通過每個(gè)音頻幀對應(yīng)的最大值及最小值、目標(biāo)音頻幀的頻域小于預(yù)設(shè)頻率的能量值、及目標(biāo)音頻幀的總能量值等信息,能夠?qū)σ纛l斷點(diǎn)所在的音頻幀進(jìn)行準(zhǔn)確判定,避免了人為主觀因素的影響,提高了對音頻檢測的準(zhǔn)確性。
附圖說明
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于騰訊音樂娛樂科技(深圳)有限公司,未經(jīng)騰訊音樂娛樂科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810191720.9/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:電機(jī)異音檢測方法
- 下一篇:一種課件的二次編輯裝置及方法





