[發明專利]一種與時長相關的相同碼率mp3雙壓縮檢測方法有效
| 申請號: | 201610018814.7 | 申請日: | 2016-01-13 |
| 公開(公告)號: | CN105513600B | 公開(公告)日: | 2019-02-05 |
| 發明(設計)人: | 王讓定;陶表犁;嚴迪群;金超;周勁蕾 | 申請(專利權)人: | 寧波大學 |
| 主分類號: | G10L19/008 | 分類號: | G10L19/008;G10L19/18 |
| 代理公司: | 寧波奧圣專利代理事務所(普通合伙) 33226 | 代理人: | 周玨 |
| 地址: | 315211 浙*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 相關 相同 mp3 壓縮 檢測 方法 | ||
1.一種與時長相關的相同碼率mp3雙壓縮檢測方法,其特征在于包括以下步驟:
①獲取一個待檢測的mp3語音,記為fr;
②獲取fr的時長和壓縮碼率,對應記為和br,其中,的單位為秒,br的單位為kbps;
所述的步驟②中fr的時長是指fr的語音內容的時間長度;
③利用具有編解碼功能的mp3編碼器對fr進行解碼,得到wav語音,同時在解碼過程中提取出QMDCT系數矩陣,記為q1;
④利用步驟③中的mp3編碼器以fr的壓縮碼率br對步驟③得到的wav語音進行編碼壓縮,得到mp3語音,同時在編碼壓縮過程中提取出QMDCT系數矩陣,記為q2;
⑤計算q1與q2的差值矩陣,記為D,D=q1-q2;
⑥將fr的時長的值分別代入一次壓縮擬合函數Y1(t)=103(A1×t-B1)和二次壓縮擬合函數Y2(t)=103(A2×t-B2)中,對應得到和然后判斷是否成立,如果成立,則確定fr為相同碼率下的雙壓縮語音;否則,確定fr為單壓縮語音,其中,Y1(t)為時長變量t的函數,A1表示Y1(t)=103(A1×t-B1)中的斜率,B1表示Y1(t)=103(A1×t-B1)中的截距,Y2(t)為時長變量t的函數,A2表示Y2(t)=103(A2×t-B2)中的斜率,B2表示Y2(t)=103(A2×t-B2)中的截距,符號“||||0”用于求矩陣中非零元素的個數;
所述的步驟⑥中的一次壓縮擬合函數Y1(t)=103(A1×t-B1)和二次壓縮擬合函數Y2(t)=103(A2×t-B2)的獲取過程為:
⑥_1、選取不同時長的原始的wav語音各N個,其中,N≥50;然后將每個時長的N個原始的wav語音構成一個語音集合;
⑥_2、將當前待處理的語音集合定義為當前語音集合;
⑥_3、將當前語音集合中當前待處理的第n個原始的wav語音定義為當前wav語音,其中,1≤n≤N,n的初始值為1;
⑥_4、利用步驟③中的mp3編碼器以fr的壓縮碼率br對當前wav語音進行編碼壓縮,得到當前wav語音經一次壓縮后形成的mp3語音,同時在編碼壓縮過程中提取出QMDCT系數矩陣,記為Qn,1;
⑥_5、利用步驟③中的mp3編碼器對當前wav語音經一次壓縮后形成的mp3語音進行解碼,得到當前wav語音經一次壓縮后形成的mp3語音再經解碼形成的wav語音;
⑥_6、利用步驟③中的mp3編碼器以fr的壓縮碼率br對當前wav語音經一次壓縮后形成的mp3語音再經解碼形成的wav語音進行編碼壓縮,得到當前wav語音經二次壓縮后形成的mp3語音,同時在編碼壓縮過程中提取出QMDCT系數矩陣,記為Qn,2;
⑥_7、利用步驟③中的mp3編碼器對當前wav語音經二次壓縮后形成的mp3語音進行解碼,得到當前wav語音經二次壓縮后形成的mp3語音再經解碼形成的wav語音;
⑥_8、利用步驟③中的mp3編碼器以fr的壓縮碼率br對當前wav語音經二次壓縮后形成的mp3語音再經解碼形成的wav語音進行編碼壓縮,同時在編碼壓縮過程中提取出QMDCT系數矩陣,記為Qn,3;
⑥_9、令n=n+1,將當前語音集合中下一個待處理的原始的wav語音作為當前wav語音,然后返回步驟⑥_4繼續執行,直至當前語音集合中的N個原始的wav語音均處理完畢,其中,n=n+1中的“=”為賦值符號;
⑥_10、令Mean1表示一次壓縮QMDCT系數均值,并令Mean2表示二次壓縮QMDCT系數均值,其中,符號“||||0”用于求矩陣中非零元素的個數;
⑥_11、將下一個待處理的語音集合作為當前語音集合,然后返回步驟⑥_3繼續執行,直至所有時長各自對應的語音集合處理完畢,得到每個時長對應的一次壓縮QMDCT系數均值和二次壓縮QMDCT系數均值;
⑥_12、對所有時長及所有時長各自對應的一次壓縮QMDCT系數均值進行線性擬合,得到一次壓縮擬合函數Y1(t)=103(A1×t-B1);并對所有時長及所有時長各自對應的二次壓縮QMDCT系數均值進行線性擬合,得到二次壓縮擬合函數Y2(t)=103(A2×t-B2);其中,Y1(t)為時長變量t的函數,A1表示Y1(t)=103(A1×t-B1)中的斜率,B1表示Y1(t)=103(A1×t-B1)中的截距,Y2(t)為時長變量t的函數,A2表示Y2(t)=103(A2×t-B2)中的斜率,B2表示Y2(t)=103(A2×t-B2)中的截距。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于寧波大學,未經寧波大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610018814.7/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種基于DSP的低速語音編解碼模塊
- 下一篇:一種語音控制方法和控制設備





