[發(fā)明專利]一種歸一化常Q倒譜特征的回放語音檢測方法有效
| 申請?zhí)枺?/td> | 201811451509.2 | 申請日: | 2018-11-30 |
| 公開(公告)號: | CN109243487B | 公開(公告)日: | 2022-12-27 |
| 發(fā)明(設(shè)計(jì))人: | 勞靈杰;嚴(yán)迪群;葉勇超;林朗 | 申請(專利權(quán))人: | 寧波大學(xué) |
| 主分類號: | G10L25/24 | 分類號: | G10L25/24;G10L25/27;G10L25/51 |
| 代理公司: | 寧波誠源專利事務(wù)所有限公司 33102 | 代理人: | 袁忠衛(wèi) |
| 地址: | 315211 浙*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 歸一化 特征 回放 語音 檢測 方法 | ||
1.一種歸一化常Q倒譜特征的回放語音檢測方法,其特征在于包括以下步驟:
S1:提取原始語音和回放語音的語音信息X(n)的聲學(xué)特征常Q倒譜系數(shù)(CQCC);
步驟S1中,提取CQCC系數(shù)包括對語音信息X(n)做CQT變換得到XCQT(k),計(jì)算功率譜得到|XCQT(k)|2,進(jìn)行對數(shù)變換得到log|XCQT(k)|2,進(jìn)行均勻重采樣得到log|XCQT(i)|2,進(jìn)行DCT變換得到CQCC(p);
具體為:
提取所述語音信息X(n)的CQCC系數(shù)包括:
S1.1:對語音信息X(n)進(jìn)行常Q變化(CQT),公式為
其中,k=1,2,...,K為序列CQ譜的頻域下標(biāo),Nk為窗口長度,基函數(shù)ak*(n)為復(fù)數(shù)時頻原子,定義
其中,fk為中心頻率,fs為采樣頻率,fk=f0·2k/b,
其中,常量b表示時間分辨率和頻率分辨率的權(quán)衡,f0為CQ譜中的最小頻率,
定義帶寬Bk=fk+1-fk=fk(21/b-1),定義常數(shù)則窗口長度
S1.2:對經(jīng)過CQT的語音信息X(n)進(jìn)行提取CQCC系數(shù),公式為
其中,q為CQCC系數(shù)的下標(biāo),i=0,1,...,K-1是XCQT在線性分布所對應(yīng)的下標(biāo);
S2:對原始語音和回放語音的CQCC系數(shù)進(jìn)行倒譜均值和方差歸一化處理,得到歸一化的CQCC系數(shù);
S3:分別將原始語音和回放語音歸一化的CQCC系數(shù)置于混合高斯模型(GMM)中進(jìn)行訓(xùn)練,得到原始語音模型和回放語音模型;
S4:提取待測語音的語音信息X(n)的聲學(xué)特征CQCC系數(shù);
S5:對待測語音的CQCC系數(shù)進(jìn)行倒譜均值和方差歸一化處理,得到歸一化的CQCC系數(shù);
S6:將待測語音歸一化的CQCC系數(shù)置于原始語音模型和回放語音模型中進(jìn)行匹配,并判斷待測語音歸一化的CQCC系數(shù)與回放語音模型的第一匹配度是否大于等于與原始語音模型的第二匹配度,若是,則為回放語音,若否,則不是回放語音。
2.根據(jù)權(quán)利要求1所述的歸一化常Q倒譜特征的回放語音檢測方法,其特征在于,步驟S3中,將歸一化的CQCC系數(shù)置于混合高斯模型中進(jìn)行訓(xùn)練得到語音模型,還包括使用混合高斯模型進(jìn)行加權(quán)參數(shù)優(yōu)化,并使用期望最大化算法進(jìn)行混合高斯模型估計(jì)。
3.根據(jù)權(quán)利要求1所述的歸一化常Q倒譜特征的回放語音檢測方法,其特征在于,步驟S2中,對CQCC系數(shù)進(jìn)行倒譜均值和方差歸一化處理包括:
定義Xt為t時刻的K維倒譜特征向量,Xt(i)代表Xt的第i個分量,X={x1,x2,...,xt,...,xT}代表長度為T的語音段,則
其中,均值為μML,方差為σ,1≤i≤K。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于寧波大學(xué),未經(jīng)寧波大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811451509.2/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 一種回放通用模塊
- 視頻回放設(shè)備和用于控制視頻回放設(shè)備的方法
- 音量限制
- 用于時間同步的多區(qū)域媒體流式傳輸?shù)南到y(tǒng)和方法
- 設(shè)備回放故障恢復(fù)和重新分配
- 回放數(shù)據(jù)獲取與流量回放方法、設(shè)備及存儲介質(zhì)
- 視頻回放方法、設(shè)備及計(jì)算機(jī)存儲介質(zhì)
- 視頻回放方法、裝置、設(shè)備和計(jì)算機(jī)可讀存儲介質(zhì)
- 用于在聯(lián)網(wǎng)回放設(shè)備之間傳送回放標(biāo)記的媒體內(nèi)容系統(tǒng)
- 一種無人機(jī)綜合監(jiān)視數(shù)據(jù)多模式回放方法及系統(tǒng)





