[發(fā)明專利]一種復雜噪聲場景下的實時語音段落追蹤方法有效
| 申請?zhí)枺?/td> | 202010029721.0 | 申請日: | 2020-01-13 |
| 公開(公告)號: | CN111261197B | 公開(公告)日: | 2022-11-25 |
| 發(fā)明(設計)人: | 馬翼平;張瑋 | 申請(專利權)人: | 中航華東光電(上海)有限公司 |
| 主分類號: | G10L25/84 | 分類號: | G10L25/84;G10L25/27;G10L25/45;G10L25/21;G10L25/93;G10L21/0216 |
| 代理公司: | 上海樂泓專利代理事務所(普通合伙) 31385 | 代理人: | 張雪 |
| 地址: | 201114 上海市*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 復雜 噪聲 場景 實時 語音 段落 追蹤 方法 | ||
1.一種復雜噪聲場景下的實時語音段落追蹤方法,其特征在于,包含以下步驟:
A、預處理:對輸入的音頻信號分幀并加窗;取16ms數據為一幀xi(n),其中i為幀號;
B、計算輸入音頻幀的離散傅里葉變換系數Yi(ωk),其中k為頻譜分量的標號;
C、假設前L幀為噪聲幀,計算初始噪聲的功率,即計算傅里葉變換幅度譜的算術平均值;假設L幀后的數據為帶噪信號,計算帶噪信號的功率|Yi(ωk)|2;
D、計算后驗信噪比γk=|Yi(ωk)|2/λd(k);
E、計算先驗信噪比
F、語音激活檢測;所述步驟F具體是:對輸入幀做語音激活檢測,挑選出噪聲幀;根據后驗信噪比γk和先驗信噪比求取激活語音檢測的判決參數v,若v大于判決門限eta則判別為語音,若小于eta則判別為噪聲,用來更新噪聲譜;判決參數v的計算方法為:
G、噪聲譜更新;所述步驟G具體是:挑選出噪聲幀后,按下式更新噪聲譜:
H、計算增益系數;
I、重建信號:計算當前幀的增強語音的幅度譜和功率譜,對增強語音的頻譜做逆傅里葉變換,即可得到重建信號;
J、計算的自相關函數其中rt(τ)為延時為τ的自相關函數,N為窗長且1≤n≤N;
K、計算差分函數:計算:
L、根據下列條件進行濁音判斷:計算p=1-d'(τ),p表征一幀語音中明顯包含某個基頻成分的概率;由于d'(τ)的取值范圍為[0,1],則p的取值范圍為[0,1];以pth作為閾值,大于pth的語音幀作為濁音保留;
M、清音補償和噪聲屏蔽。
2.根據權利要求1所述的一種復雜噪聲場景下的實時語音段落追蹤方法,其特征在于,
所述步驟A中對輸入的音頻信號分幀并加窗,窗函數為漢明窗:
3.根據權利要求1所述的一種復雜噪聲場景下的實時語音段落追蹤方法,其特征在于,
所述步驟H具體是:根據后驗信噪比和先驗信噪比計算當前幀幅度譜的加權系數:
4.根據權利要求1所述的一種復雜噪聲場景下的實時語音段落追蹤方法,其特征在于,
所述步驟I建好的函數為:
5.根據權利要求1所述的一種復雜噪聲場景下的實時語音段落追蹤方法,其特征在于,
所述步驟M中,若某幀被判定為濁音,而其后400毫秒內的信號幀為非濁音,則進行補償,即不對其進行處理直接輸出;對不滿足補償條件的非濁音幀進行屏蔽,即做限幅處理后輸出。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中航華東光電(上海)有限公司,未經中航華東光電(上海)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010029721.0/1.html,轉載請聲明來源鉆瓜專利網。





