[發明專利]一種AMR音頻的鑒定方法在審

申請號：	201410017066.1	申請日：	2014-01-14
公開（公告）號：	CN103871405A	公開（公告）日：	2014-06-18
發明（設計）人：	羅達;楊銳;黃繼武	申請（專利權）人：	中山大學;深圳大學
主分類號：	G10L15/08	分類號：	G10L15/08;G10L19/16
代理公司：	廣州粵高專利商標代理有限公司 44102	代理人：	林麗明
地址：	510275 廣東***	國省代碼：	廣東;44
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	一種 amr 音頻鑒定方法
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【權利要求書】：

1.一種AMR音頻的鑒定方法，其特征在于，

采用深度學習算法構造一次AMR壓縮的分類器模型和二次AMR壓縮的分類器模型；

采用多數表決投票機制判斷待檢測音頻；

其中所述采用深度學習算法構造分類器模型的具體方式為：

將采樣率為8000Hz、16bit的錄制音頻存放在WAV格式中，使用AMR編碼器將該音頻壓縮成一次AMR壓縮文件，其中壓縮碼率為：4.7-12.2kbps；

將一次AMR壓縮文件解壓縮成為WAV格式的文件，再次使用AMR編碼器將其壓縮成二次AMR壓縮文件，其中壓縮碼率為：4.7-12.2kbps；

將一次AMR壓縮和二次AMR壓縮的音頻解壓縮，得到音頻波形信號；將音頻波形信號正則化之后切分為音頻小段，采用深度學習算法對音頻小段進行訓練，得到一次AMR壓縮的分類器模型和二次AMR壓縮的分類器模型；

采用多數表決投票機制判斷待檢測音頻的具體方式為：

將待檢測音頻切分為若干個音頻段，將每個音頻段切分為若干個音頻小段，采用上述的一次AMR壓縮的分類器模型或二次AMR壓縮的分類器模型來判斷各個音頻小段；當音頻段中多數音頻小段屬于一次AMR壓縮則該音頻段為一次AMR壓縮，當音頻段中多數音頻小段屬于二次AMR壓縮則該音頻段為二次AMR壓縮。

2.根據權利要求1所述的AMR音頻的鑒定方法，其特征在于，采用SAE或Dropout的方法對音頻小段進行訓練，其中采用Dropout方法時，其Dropout比率為0.5。

3.根據權利要求1所述的AMR音頻的鑒定方法，其特征在于，所述將音頻波形信號正則化是將音頻波形信號減去均值并除以標準差的波形信號。

4.根據權利要求1、2或3所述的AMR音頻的鑒定方法，其特征在于，將待檢測音頻切分為若干個1秒鐘的音頻段，將各1秒鐘的音頻段分別切分成20個音頻小段，各音頻小段含400個樣本點。

5.根據權利要求1、2或3所述的AMR音頻的鑒定方法，其特征在于，將待檢測音頻切分為若干個2秒鐘的音頻段，將各2秒鐘的音頻段分別切分成40個音頻小段，各音頻小段含400個樣本點。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于中山大學;深圳大學，未經中山大學;深圳大學許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201410017066.1/1.html，轉載請聲明來源鉆瓜專利網。

專利分類

專利文獻下載

說明：

1、專利原文基于中國國家知識產權局專利說明書；

2、支持發明專利、實用新型專利、外觀設計專利（升級中）；

3、專利數據每周兩次同步更新，支持Adobe PDF格式；

4、內容包括專利技術的結構示意圖、流程工藝圖或技術構造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】