[發明專利]一種極短語音語種識別特征提取方法在審
| 申請號: | 202110755053.4 | 申請日: | 2021-07-02 |
| 公開(公告)號: | CN113380226A | 公開(公告)日: | 2021-09-10 |
| 發明(設計)人: | 劉俊南;郭鵬;江海;魏欣;齊心 | 申請(專利權)人: | 因諾微科技(天津)有限公司 |
| 主分類號: | G10L15/00 | 分類號: | G10L15/00;G10L15/20;G10L25/03;G10L25/18 |
| 代理公司: | 天津諾德知識產權代理事務所(特殊普通合伙) 12213 | 代理人: | 朱卉 |
| 地址: | 300000 天津市濱海新區華苑產業*** | 國省代碼: | 天津;12 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 語音 語種 識別 特征 提取 方法 | ||
1.一種極短語音語種識別特征提取方法,其特征在于,所述方法包括步驟:
獲取輸入語音信號;
對所述輸入語音信號進行預處理;
獲取基于線性預測系數算法;
使用所述基于線性預測系數算法對所述輸入語音信號進行特征提取。
2.根據權利要求1所述的極短語音語種識別特征提取方法,其特征在于,所述對所述輸入語音信號進行預處理包括步驟:
對所述輸入語音信號進行降噪處理;
基于信噪比SNR對所述輸入語音信號進行靜音檢測處理;
將所述輸入語音信號分割為預設長度的有效語音。
3.根據權利要求2所述的極短語音語種識別特征提取方法,其特征在于,所述基于信噪比SNR對所述輸入語音信號進行靜音檢測處理包括步驟:
獲取降噪處理后的所述輸入語音信號;
去除所述輸入語音信號中的非語音段;
保留所述輸入語音信號中的有效語音段。
4.根據權利要求2所述的極短語音語種識別特征提取方法,其特征在于,所述將所述輸入語音信號分割為預設長度的有效語音包括步驟:
獲取靜音檢測處理后的有效語音段;
將所述有效語音段分割為預設長度的多段有效語音;
對每段所述有效語音進行單獨語種識別;
將多段所述有效語音語種識別結果進行得分融合;
判斷得分是否達到預設置信度閾值;
若是,獲取所有所述有效語音;
若否,返回所述對每段所述有效語音進行單獨語種識別步驟。
5.根據權利要求1所述的極短語音語種識別特征提取方法,其特征在于,所述使用所述基于線性預測系數算法對所述輸入語音信號進行特征提取包括步驟:
獲取所述輸入語音信號中的有效語音;
對所述有效語音應用離散余弦變換并得到頻域表示;
在所述頻域表示上進行子帶分解并得到子帶表示分量;
對每個所述子帶表示分量進行線性預測分析并得到子帶頻域線性預測系數;
應用離散余弦變換計算所述子帶頻域線性預測系數的頻域等價物;
計算幅度特征信號;
使用能量插值方法降低所述幅度特征信號的特征數據量;。
得到子帶頻域線性預測系數的幅度特征。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于因諾微科技(天津)有限公司,未經因諾微科技(天津)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110755053.4/1.html,轉載請聲明來源鉆瓜專利網。





