[發明專利]基于聲紋識別的錄音優化方法及其錄音優化系統在審
| 申請號: | 201810048832.9 | 申請日: | 2018-01-18 |
| 公開(公告)號: | CN108198560A | 公開(公告)日: | 2018-06-22 |
| 發明(設計)人: | 桂峰 | 申請(專利權)人: | 安徽三弟電子科技有限責任公司 |
| 主分類號: | G10L17/00 | 分類號: | G10L17/00;G10L15/00;G10L21/0272;G10L15/22 |
| 代理公司: | 上海精晟知識產權代理有限公司 31253 | 代理人: | 馮子玲 |
| 地址: | 241000 *** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 錄音 優化 聲紋識別 波動頻率 錄音內容 優化系統 聲源 組排 錄制 時間記錄 音頻信息 分幀 聲紋 音源 刪除 保存 合并 清晰 | ||
1.基于聲紋識別的錄音優化方法,其特征在于,包括如下步驟:
步驟一,根據聲紋識別將所述錄音內容中某一聲源進行提取,并按照10-20ms為一段進行分幀;
步驟二,對每幀聲源進行逐一識別,將所述無波動頻率幀進行合并刪除,并將上述每一無波動頻率幀音頻按照時間記錄進行重新組排;
步驟三,將所述組排錄音進行標準音優化和平緩優化;
步驟四,將上述優化錄音內容進行保存。
2.根據權利要求1所述的基于聲紋識別的錄音優化方法,其特征在于,如步驟一中所述錄音內容將某一特定聲紋與其他聲紋進行分離并進行分別存儲,并將上述特定聲紋的數字存儲信息轉換為模擬信息進行分幀。
3.根據權利要求1任意一所述的基于聲紋識別的錄音優化方法,其特征在于,如步驟二中所述無波動頻率幀為模擬信息通過聲紋圖表示中無波動段。
4.根據權利要求1任意一所述的基于聲紋識別的錄音優化方法,其特征在于,所述驟三中標準音優化通過孤立詞識別、關鍵詞識別或連續語音識別中的一種或兩種優化方式進行,平緩優化通過將所述組排后錄音內容中相鄰兩幀之間增加無波動頻率幀;其中平緩優化在數字存儲音頻信息中進行。
5.如權利要求1-4中任意一所述的基于聲紋識別的錄音優化系統,其特征在于,還包括用于分離特定聲紋的聲紋提取單元:
所述聲紋提取單元將所述錄音信息中特定音頻信息存儲到第二存儲模塊中并將其他音頻信息存儲到第一存儲模塊中,所述第二存儲模塊中存儲音頻信息依次經標準音優化和平緩優化后存儲到第三存儲模塊內;
其中,標準音優化和平緩優化所優化的音頻信息均為數字音頻信息。
6.根據權利要求5所述的基于聲紋識別的錄音優化系統,其特征在于,還包括用于音頻對比的標準音頻信息存儲單元和用于增加無波動頻率幀的增加模塊;所述標準音頻信息存儲單元包括對比模塊和更換模塊;
所述對比模塊用于對第二存儲模塊中存儲的音頻數字信息與標準音頻信息存儲單元中存儲的音頻數字信息進行分析對比,所述更換模塊用于將第二存儲模塊中存儲的音頻數字信息更換為與標準音頻信息存儲單元中存儲的相同意思的音頻數字信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于安徽三弟電子科技有限責任公司,未經安徽三弟電子科技有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810048832.9/1.html,轉載請聲明來源鉆瓜專利網。





