[發明專利]一種基于頻域信息量分布的回放語音檢測方法有效
| 申請號: | 201610023352.8 | 申請日: | 2016-01-14 |
| 公開(公告)號: | CN105513598B | 公開(公告)日: | 2019-04-23 |
| 發明(設計)人: | 王讓定;陳亞楠;嚴迪群;金超;陶表犁;張立 | 申請(專利權)人: | 寧波大學 |
| 主分類號: | G10L17/14 | 分類號: | G10L17/14;G10L15/08 |
| 代理公司: | 寧波天一專利代理有限公司 33207 | 代理人: | 劉賽云 |
| 地址: | 315211 浙*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 信息量 分布 回放 語音 檢測 方法 | ||
1.一種基于頻域信息量分布的回放語音檢測方法,其特征在于該檢測方法包括如下步驟:
步驟一、提取語音信號的語音頻率信息量,設待測語音信號或原始語音信號為X,將待檢測語音信號如下操作:
(1)將語音信號做分幀處理,設共T幀,然后第i幀語音采樣值做N點離散傅里葉變換,所述N為256、512、1024;則第i幀短時傅里葉變換為按照公式一進行計算,
公式一,
式中:
——傅里葉變換數值;
——傅里葉變換的離散頻率參數;
——語段語音信號中每個采樣點;
(2)按照公式二對第j幀第i個頻率點的頻率值,求幅值;
公式二,
式中:
——第i幀j列的傅里葉變換數值;
——傅里葉變換的離散頻率參數;
(3)按照公式三對第j點頻率求其時間上的平均;
公式三,
式中:
——表示第j個頻率值在時間上的平均;
——第i幀j列的傅里葉變換數值;
(4)按照公式四對總頻率點上頻率值求和;
公式四,
式中:
——表示各頻率值之和;
——表示第j個頻率值在時間上的平均;
(5)按照公式五求每一個頻率點出現的概率;
公式五,
式中:
——表示第j個頻率值占總頻率值的比重;
——表示第j個頻率值在時間上的平均;
——表示各頻率值之和;
(6)按照公式六對第j頻域點求信息量;
公式六,
式中:
——標志第j頻率點的信息量;
——表示第j個頻率值占總頻率值得比重;
通過上述計算過程分別將待測語音信號和原始語音信號轉換為一維數據;
步驟二、選取步驟一中語音信號的前N/2個頻率點的信息量作為初步特征;
步驟三、從語音信號選取的初步特征中低頻區特征提取部分中篩選特征集,并選取連續的頻率點作為最終特征集;
步驟四:通過分類器分別對回放語音信號的特征集和原始語音信號的特征集進行訓練模型,將待測語音在訓練模型上進行測試,并由分類器最終判斷待測語音信號是否為回放語音。
2.根據權利要求1所述的一種基于頻域信息量分布的回放語音檢測方法,其特征在于所述的特征集篩選工具為懷卡托智能分析環境Weka。
3.根據權利要求1所述的一種基于頻域信息量分布的回放語音檢測方法,其特征在于所述的分類器為LibSVM分類器。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于寧波大學,未經寧波大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610023352.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種智能化信息技術播放設備
- 下一篇:一種語音驅動的智能人機交互方法





