[發(fā)明專利]語音控制的方法、裝置、設備和存儲介質有效
| 申請?zhí)枺?/td> | 201810235732.7 | 申請日: | 2018-03-21 |
| 公開(公告)號: | CN108461081B | 公開(公告)日: | 2020-07-31 |
| 發(fā)明(設計)人: | 李志銘 | 申請(專利權)人: | 北京金山安全軟件有限公司 |
| 主分類號: | G10L15/20 | 分類號: | G10L15/20;G10L21/0232 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 100085 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 控制 方法 裝置 設備 存儲 介質 | ||
本發(fā)明公開了一種語音控制的方法、裝置、設備和存儲介質,該方法包括:對終端設備采集的語音信號進行信號處理得到頻域信號;提取所述頻域信號中的第一頻率范圍內的目標頻域信號,將所述目標頻域信號遷移至第二頻率范圍內的合成頻域信號上,形成完整頻域信號;將所述完整頻域信號變換為時域信號,對所述時域信號進行語音識別并根據(jù)語音識別結果控制所述終端設備進行響應,實現(xiàn)將易受環(huán)境影響的語音信號遷移到不易受環(huán)境影響的頻段中,增強抗干擾能力,降低語音信號的失真度,提高終端設備對語音信號的識別率和語音控制的準確性。
技術領域
本發(fā)明實施例涉及語音識別技術領域,尤其涉及一種語音控制的方法、裝置、設備和存儲介質。
背景技術
根據(jù)國際電工協(xié)會IEC581標準與我國的GB/T14277-93標準,把30-150Hz設定為低頻段,150-500Hz為中低頻段,500-5KHz為中高頻段,5K-16KHz為高頻段。其中男聲基準音區(qū)的頻率為60-523Hz,女聲基準音區(qū)的頻率為160-1200Hz?;糁芷谛畔⒃谡Z音識別、說話人識別、語音分析與語音合成,以及低碼率語音編碼、發(fā)音系統(tǒng)疾病診斷、聽覺殘障者的語言指導等多個領域有著廣泛的應用。
基音對于語音識別起著很關鍵的作用,人類的基音區(qū)為頻率200Hz以下的范圍。目前智能音箱等基于語音控制的終端設備主要采用麥克風來拾音,而麥克風與喇叭在播放高聲壓時,由于在低頻音在大聲壓下喇叭震動大,低頻音的失真度高,經分析市場上的幾大智能音箱,發(fā)現(xiàn)語音頻率位于200Hz以下的音頻信號,喇叭播放出來的音頻信息的失真度比較大,尤其是對語音頻率位于100Hz左右的低頻語音信號的總諧波失真加噪聲(TotalHarmonic Distortion+Noise,THD+N)的值達到10%以上,這對于語音識別系統(tǒng)的回聲消除算法處理帶來很大的挑戰(zhàn),低頻語音信號會使得智能音箱的箱體產生更強烈的震動,在麥克風拾音過程中造成非線性失真的問題,麥克風采集到的數(shù)據(jù)就與真實的數(shù)據(jù)差別越大,智能音箱無法識別出帶有語音控制關鍵詞的語音信號,導致智能音箱等設備的語音控制成功率低。
發(fā)明內容
本發(fā)明提供一種語音控制的方法、裝置、設備和存儲介質,以實現(xiàn)將易受環(huán)境影響的語音信號遷移到不易受環(huán)境影響的頻段中,增強抗干擾能力,降低語音信號的失真度,提高終端設備對語音信號的識別率和語音控制的準確性。
第一方面,本發(fā)明實施例提供了一種語音控制的方法,該方法包括:
對終端設備采集的語音信號進行信號處理得到頻域信號;
提取所述頻域信號中的第一頻率范圍內的目標頻域信號,將所述目標頻域信號遷移至第二頻率范圍內的合成頻域信號上,形成完整頻域信號;
將所述完整頻域信號變換為時域信號,對所述時域信號進行語音識別并根據(jù)語音識別結果控制所述終端設備進行響應。
第二方面,本發(fā)明實施例還提供了一種語音控制的裝置,該裝置包括:
信號轉換模塊,用于對終端設備采集的語音信號進行信號處理得到頻域信號;
完整頻域信號生成模塊,用于提取所述頻域信號中的第一頻率范圍內的目標頻域信號,將所述目標頻域信號遷移至第二頻率范圍內的合成頻域信號上,形成完整頻域信號;
信號變換響應模塊,用于將所述完整頻域信號變換為時域信號,對所述時域信號進行語音識別并根據(jù)語音識別結果控制所述終端設備進行響應。
第三方面,本發(fā)明實施例還提供了一種終端設備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,該處理器執(zhí)行程序時實現(xiàn)上述語音控制的方法。
第四方面,本發(fā)明實施例還提供了一種計算機可讀存儲介質,其上存儲有計算機程序,該程序被處理器執(zhí)行時實現(xiàn)上述語音控制的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京金山安全軟件有限公司,未經北京金山安全軟件有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810235732.7/2.html,轉載請聲明來源鉆瓜專利網。





