[發明專利]音頻拼接檢測方法、系統、移動終端及存儲介質有效
| 申請號: | 202010594336.0 | 申請日: | 2020-06-28 |
| 公開(公告)號: | CN111933180B | 公開(公告)日: | 2023-04-07 |
| 發明(設計)人: | 曾志先;肖龍源;李稀敏;葉志堅;劉曉葳 | 申請(專利權)人: | 廈門快商通科技股份有限公司 |
| 主分類號: | G10L25/51 | 分類號: | G10L25/51;G10L25/30;G06N3/044;G06N3/08 |
| 代理公司: | 廈門仕誠聯合知識產權代理事務所(普通合伙) 35227 | 代理人: | 樂珠秀 |
| 地址: | 361009 福建省廈門市*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 音頻 拼接 檢測 方法 系統 移動 終端 存儲 介質 | ||
1.一種音頻拼接檢測方法,其特征在于,所述方法包括:
獲取原始音頻數據,若檢測到任一所述原始音頻的音頻時長未在預設時長范圍內,則對所述原始音頻進行音頻裁剪或音頻填充;
根據預設切分數量分別對每個所述原始音頻進行隨機切分,得到切分音頻;
對所述切分音頻進行拼接,得到拼接音頻,分別對所述拼接音頻和所述原始音頻進行音頻特征提取,得到拼接音頻特征和原始音頻特征;
分別對所述原始音頻特征和所述拼接音頻特征進行歸一化處理,并根據歸一化處理后的所述原始音頻特征和所述拼接音頻特征對預設循環神經網絡進行訓練,得到音頻檢測模型;
將待測音頻輸入所述音頻檢測模型,并控制所述音頻檢測模型進行音頻拼接檢測,以輸出檢測結果;
所述對所述切分音頻進行拼接的步驟包括:
根據所述預設切分數量對所述切分音頻進行抽取,將抽取到的所述切分音頻進行拼接,得到所述拼接音頻。
2.如權利要求1所述的音頻拼接檢測方法,其特征在于,所述分別對所述原始音頻特征和所述拼接音頻特征進行歸一化處理的步驟包括:
分別對所述原始音頻特征和所述拼接音頻特征進行數值標準化處理,以得到原始音頻原數值和拼接音頻原數值;
分別對所述原始音頻原數值和所述拼接音頻原數值進行平均值計算和標準差計算,以得到原始音頻平均值、原始音頻標準差、拼接音頻平均值和拼接音頻標準差;
根據標準化計算公式分別對所述原始音頻原數值和所述拼接音頻原數值進行計算,以得到原始音頻歸一值和拼接音頻歸一值。
3.如權利要求2所述的音頻拼接檢測方法,其特征在于,所述據歸一化處理后的所述原始音頻特征和所述拼接音頻特征對預設循環神經網絡進行訓練的步驟包括:
將所述原始音頻歸一值設置為正樣本,并所述拼接音頻歸一值設置為負樣本;
根據所述正樣本和所述負樣本對所述預設循環神經網絡進行模型訓練,并對所述預設循環神經網絡進行損失計算,得到損失值;
根據所述損失值對所述預設循環神經網絡進行優化迭代,直至所述預設循環神經網絡滿足預設結束條件,將所述預設循環神經網絡進行輸出,得到所述音頻檢測模型。
4.如權利要求1所述的音頻拼接檢測方法,其特征在于,所述檢測結果包括原始音頻分數值和拼接音頻分數值,所述輸出檢測結果的步驟之后,所述方法還包括:
采用SoftMax函數對所述原始音頻分數值和所述拼接音頻分數值進行概率計算,以得到拼接概率值;
若所述拼接概率小于概率閾值,則判定所述待測音頻是拼接的音頻。
5.如權利要求1所述的音頻拼接檢測方法,其特征在于,所述分別對所述拼接音頻和所述原始音頻進行音頻特征提取的步驟包括:
分別對所述拼接音頻和所述原始音頻進行短時傅里葉變換處理,得到拼接STFT特征和原始STFT特征。
6.一種音頻拼接檢測系統,其特征在于,所述系統包括:
音頻切分模塊,用于獲取原始音頻數據,若檢測到任一所述原始音頻的音頻時長未在預設時長范圍內,則對所述原始音頻進行音頻裁剪或音頻填充;
根據預設切分數量分別對每個所述原始音頻進行隨機切分,得到切分音頻;
音頻拼接模塊,用于對所述切分音頻進行拼接,得到拼接音頻,分別對所述拼接音頻和所述原始音頻進行音頻特征提取,得到拼接音頻特征和原始音頻特征;
模型訓練模塊,用于分別對所述原始音頻特征和所述拼接音頻特征進行歸一化處理,并根據歸一化處理后的所述原始音頻特征和所述拼接音頻特征對預設循環神經網絡進行訓練,得到音頻檢測模型;
音頻檢測模塊,用于將待測音頻輸入所述音頻檢測模型,并控制所述音頻檢測模型進行音頻拼接檢測,以輸出檢測結果;
所述音頻拼接模塊還用于:根據所述預設切分數量對所述切分音頻進行抽取,將抽取到的所述切分音頻進行拼接,得到所述拼接音頻。
7.一種移動終端,其特征在于,包括存儲設備以及處理器,所述存儲設備用于存儲計算機程序,所述處理器運行所述計算機程序以使所述移動終端執行根據權利要求1至5任一項所述的音頻拼接檢測方法。
8.一種存儲介質,其特征在于,其存儲有權利要求7所述的移動終端中所使用的計算機程序,該計算機程序被處理器執行時實現權利要求1至5任一項所述的音頻拼接檢測方法的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廈門快商通科技股份有限公司,未經廈門快商通科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010594336.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種大豆ACE抑制肽及其制備方法和應用
- 下一篇:泡沫切割粉碎裝置





