[發明專利]一種AMR音頻的鑒定方法在審
| 申請號: | 201410017066.1 | 申請日: | 2014-01-14 |
| 公開(公告)號: | CN103871405A | 公開(公告)日: | 2014-06-18 |
| 發明(設計)人: | 羅達;楊銳;黃繼武 | 申請(專利權)人: | 中山大學;深圳大學 |
| 主分類號: | G10L15/08 | 分類號: | G10L15/08;G10L19/16 |
| 代理公司: | 廣州粵高專利商標代理有限公司 44102 | 代理人: | 林麗明 |
| 地址: | 510275 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 amr 音頻 鑒定 方法 | ||
1.一種AMR音頻的鑒定方法,其特征在于,
采用深度學習算法構造一次AMR壓縮的分類器模型和二次AMR壓縮的分類器模型;
采用多數表決投票機制判斷待檢測音頻;
其中所述采用深度學習算法構造分類器模型的具體方式為:
將采樣率為8000Hz、16bit的錄制音頻存放在WAV格式中,使用AMR編碼器將該音頻壓縮成一次AMR壓縮文件,其中壓縮碼率為:4.7-12.2kbps;
將一次AMR壓縮文件解壓縮成為WAV格式的文件,再次使用AMR編碼器將其壓縮成二次AMR壓縮文件,其中壓縮碼率為:4.7-12.2kbps;
將一次AMR壓縮和二次AMR壓縮的音頻解壓縮,得到音頻波形信號;將音頻波形信號正則化之后切分為音頻小段,采用深度學習算法對音頻小段進行訓練,得到一次AMR壓縮的分類器模型和二次AMR壓縮的分類器模型;
采用多數表決投票機制判斷待檢測音頻的具體方式為:
將待檢測音頻切分為若干個音頻段,將每個音頻段切分為若干個音頻小段,采用上述的一次AMR壓縮的分類器模型或二次AMR壓縮的分類器模型來判斷各個音頻小段;當音頻段中多數音頻小段屬于一次AMR壓縮則該音頻段為一次AMR壓縮,當音頻段中多數音頻小段屬于二次AMR壓縮則該音頻段為二次AMR壓縮。
2.根據權利要求1所述的AMR音頻的鑒定方法,其特征在于,采用SAE或Dropout的方法對音頻小段進行訓練,其中采用Dropout方法時,其Dropout比率為0.5。
3.根據權利要求1所述的AMR音頻的鑒定方法,其特征在于,所述將音頻波形信號正則化是將音頻波形信號減去均值并除以標準差的波形信號。
4.根據權利要求1、2或3所述的AMR音頻的鑒定方法,其特征在于,將待檢測音頻切分為若干個1秒鐘的音頻段,將各1秒鐘的音頻段分別切分成20個音頻小段,各音頻小段含400個樣本點。
5.根據權利要求1、2或3所述的AMR音頻的鑒定方法,其特征在于,將待檢測音頻切分為若干個2秒鐘的音頻段,將各2秒鐘的音頻段分別切分成40個音頻小段,各音頻小段含400個樣本點。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中山大學;深圳大學,未經中山大學;深圳大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410017066.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:氨綸印花雙抗雙面料及其生產方法
- 下一篇:一種易去污抗雙面料及生產方法





