[發(fā)明專利]一種基于機器學(xué)習(xí)的智能呼叫系統(tǒng)中的噪聲識別方法有效
| 申請?zhí)枺?/td> | 201911077584.1 | 申請日: | 2019-11-06 |
| 公開(公告)號: | CN110933235B | 公開(公告)日: | 2021-07-27 |
| 發(fā)明(設(shè)計)人: | 伍林;尹朝陽 | 申請(專利權(quán))人: | 杭州哲信信息技術(shù)有限公司 |
| 主分類號: | H04M3/18 | 分類號: | H04M3/18;H04M3/50;G10L21/0208;G10L21/0232 |
| 代理公司: | 北京君泊知識產(chǎn)權(quán)代理有限公司 11496 | 代理人: | 王程遠 |
| 地址: | 310000 浙江省杭州市西湖*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 機器 學(xué)習(xí) 智能 呼叫 系統(tǒng) 中的 噪聲 識別 方法 | ||
本發(fā)明公開了一種基于機器學(xué)習(xí)的智能呼叫系統(tǒng)中的噪聲識別方法,包括:將電話信號切片處理,并歸一化和分幀預(yù)處理;對分幀后的切片信號,提取MFCC特征并進行取平均處理;將平均處理后的MFCC特征輸入機器學(xué)習(xí)分類器進行模型訓(xùn)練,訓(xùn)練好的分類模型作為噪聲分類模型;將新增的電話信號進行切片處理;對切片信號進行歸一化和分幀預(yù)處理;對分幀后的切片信號,進行頻譜平坦度初步篩選;提取MFCC特征后取平均處理;將各段信號平均處理后的MFCC特征輸入噪聲分類模型進行識別。本發(fā)明的有益效果:通過基于機器學(xué)習(xí)的分類模型來識別信號人聲還是噪聲,可以去除電話信號中的大量噪聲信號,從而減少信號被送往ASR翻譯為文字的錯誤率。
技術(shù)領(lǐng)域
本發(fā)明涉及音頻處理技術(shù)領(lǐng)域,具體而言,涉及一種基于機器學(xué)習(xí)的智能呼叫系統(tǒng)中的噪聲識別方法。
背景技術(shù)
在現(xiàn)有的智能呼叫系統(tǒng)中,電話信號會經(jīng)過VAD截取,然后送往ASR轉(zhuǎn)換成文字。由于背景的復(fù)雜,存在大量的噪聲片段。通常的處理方法是在信號截取前使用噪聲抑制方法對信號進行過濾,主要基于信號的頻率分布,對噪聲進行估計,常用的算法有自適應(yīng)濾波器,譜減法,維納濾波法等。自適應(yīng)濾波器利用前一刻獲得的濾波器參數(shù),自動調(diào)節(jié)當前濾波器參數(shù),以適應(yīng)信號和噪聲隨機變化的統(tǒng)計特性,從而實現(xiàn)過濾噪聲;譜減法主要是在頻域?qū)υ肼暤念l譜進行去除,然后通過逆傅里葉變換將頻域信號恢復(fù)成時域信號;維納濾波法主要通過設(shè)計數(shù)字濾波器來去除噪聲。這些噪聲抑制方法,只能過濾一部分噪聲,而不能將截取的噪聲片段完全去除,并且隨著電話信號中信噪比的減小,降噪效果隨之變差,還會出現(xiàn)某些時段由于過度衰減導(dǎo)致得音頻失真。
發(fā)明內(nèi)容
為解決上述問題,本發(fā)明的目的在于提供一種基于機器學(xué)習(xí)的智能呼叫系統(tǒng)中的噪聲識別方法,通過基于機器學(xué)習(xí)的分類模型來識別信號為人聲還是噪聲,可以去除電話信號中的大量噪聲信號,從而減少信號被送往ASR翻譯為文字的錯誤率。
本發(fā)明提供了一種基于機器學(xué)習(xí)的智能呼叫系統(tǒng)中的噪聲識別方法,包括:
步驟1,將采樣好的電話信號作為訓(xùn)練數(shù)據(jù),基于機器學(xué)習(xí)建立噪聲分類模型:
步驟101,將電話信號進行切片處理,并對切片信號進行歸一化和分幀的預(yù)處理;
步驟102,對分幀后的切片信號,提取MFCC特征,并對提取出的MFCC特征進行取平均處理;
步驟103,將平均處理后的MFCC特征輸入機器學(xué)習(xí)分類器,進行模型訓(xùn)練,訓(xùn)練好的分類模型作為噪聲分類模型;
步驟2,利用建立好的噪聲分類模型,把新增的電話信號輸入到具體的噪聲分類模型中,得出噪聲識別結(jié)果:
步驟201,將新增的電話信號進行切片處理;
步驟202,對切片信號進行歸一化和分幀的預(yù)處理;
步驟203,對分幀后的切片信號,進行頻譜平坦度初步篩選;
步驟204,經(jīng)過頻譜平坦度初步篩選后,將分幀信號分為奇數(shù)段,分別提取每段信號的MFCC特征后進行取平均處理;
步驟205將各段信號平均化處理的MFCC特征輸入噪聲分類模型進行識別,識別出切片信號中的噪聲。
作為本發(fā)明進一步的改進,在預(yù)處理時,采用式(1)來進行歸一化處理,將切片信號統(tǒng)一經(jīng)過16位量化,取值范圍在-65535到65535之間,通過除以信號絕對值的最大值將信號歸一化到-1到1之間;
式中,x為需要處理的切片信號,|x|為該切片信號的絕對值,為歸一化后的切片信號。
作為本發(fā)明進一步的改進,切片信號在分幀處理時,幀長取為30ms,幀移取為10ms。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于杭州哲信信息技術(shù)有限公司,未經(jīng)杭州哲信信息技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911077584.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 根據(jù)用戶學(xué)習(xí)效果動態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個人化學(xué)習(xí)服務(wù)的方法
- 漸進式學(xué)習(xí)管理方法及漸進式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲介質(zhì)
- 基于強化學(xué)習(xí)的自適應(yīng)移動學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲介質(zhì)
- 游戲?qū)W習(xí)效果評測方法及系統(tǒng)





