[發明專利]一種語音信號降噪方法及裝置在審
| 申請號: | 202010099456.3 | 申請日: | 2020-02-18 |
| 公開(公告)號: | CN111402912A | 公開(公告)日: | 2020-07-10 |
| 發明(設計)人: | 李鵬;馬金龍 | 申請(專利權)人: | 云知聲智能科技股份有限公司;廈門云知芯智能科技有限公司 |
| 主分類號: | G10L21/0208 | 分類號: | G10L21/0208;G10L21/0216;G10L21/0272;G10L21/028;G06K9/00 |
| 代理公司: | 北京冠和權律師事務所 11399 | 代理人: | 張楠楠 |
| 地址: | 100000 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 語音 信號 方法 裝置 | ||
本發明公開了一種語音信號降噪方法及裝置,包括:獲取實時圖像;分析實時圖像,從預設圖像確定出多個聲源方向;對聲源方向進行標注以區分人聲方向信息和噪聲方向信息;根據所述人聲方向信息和噪聲方向信息對所述實時圖像內的聲音數據進行降噪;輸出降噪后的聲音數據。通過利用實時圖像中人聲方向信息和噪聲方向信息對實時圖像內的聲音數據進行降噪,使得處理的過程中提供多個方向的聲音數據來進行降噪,并且利用了實時圖像中的人聲方向和噪聲方向來對聲音數據進行降噪,通過人聲和噪聲的方向可以將聲音數據中的人聲和噪聲分離開來,使得最終的去噪效果更加明顯和高效。
技術領域
本發明涉及語音信號處理技術領域,尤其涉及一種語音信號降噪方法及裝置。
背景技術
目前,隨著科技的進步和發展,人們的生活質量越來越高,在享受物質生活的基礎上去追求更高的精神生活,在他們的閑暇時間去KTV和酒吧等娛樂設施去放松身心,但由于上述環境中的聲音都比較嘈雜,在人們說話的過程中會有大量的噪音亂入,對于人們之間的交流有很大的影響,于是針對這項問題研究出了降噪方法,現有的降噪方法為通過確定發音人的方位,采集發音人的發音信息,基于此信息指導波束形成做固定方向的語音增強,進而實現降噪。上述技術方法存在以下缺點,單純的對人聲語音進行增強,實際的原理是通過提高人聲語音來降低噪音的干擾,從本質上沒有去處噪音使得固定波束形成方法無法獲得令人滿意的噪聲抑制效果,并且上述方法在低信噪比的環境下語音的增強效果不強,影響了用戶的使用體驗。
發明內容
針對上述所顯示出來的問題,本方法基于從實時圖像中確定人聲和噪聲方向信息進而根據人聲和噪聲方向信息對聲音數據進行降噪,最后輸出降噪后的聲音數據,獲得純凈的人聲。
一種語音信號降噪方法,包括以下步驟:
獲取實時圖像;
分析所述實時圖像,從所述實時圖像確定出多個聲源方向;
對所述聲源方向進行標注以區分人聲方向信息和噪聲方向信息;
根據所述人聲方向信息和噪聲方向信息對所述實時圖像內的聲音數據進行降噪;
輸出降噪后的聲音數據。
優選的,所述獲取實時圖像,包括:
在實時環境中心設置一個能夠360°旋轉的攝像頭;
啟動所述攝像頭,利用所述攝像頭獲取所述實時環境內整體的圖像;
確定所述整體的圖像為所述實時圖像。
優選的,所述分析所述實時圖像,從所述實時圖像確定出多個聲源方向,包括:
利用目標檢測算法識別出所述實時圖像內的能夠發音的物體,所述能夠發音的物體包括用戶在內;
記錄所述能夠發音的物體中每個物體的具體位置;
基于所述具體位置,利用波向傳達算法確定出所述各物體的聲源方向。
優選的,所述根據所述人聲方向信息和噪聲方向信息對所述實時圖像內的聲音數據進行降噪,包括:
利用固定方向波束形成算法對所述聲音數據作增強處理;
將增強處理后的所述聲音數據中的人聲數據確認為當前帶噪信號;
將增強處理后的所述聲音數據中的噪聲數據確認為噪聲參考信號;
將所述當前帶噪信號和所述噪聲參考信號輸入到波束形成器中作自適應降噪處理。
優選的,所述輸出降噪后的聲音數據,包括:;
利用所述波束形成器將所述當前帶噪語音中的當前人聲成分和當前噪聲成分分離;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于云知聲智能科技股份有限公司;廈門云知芯智能科技有限公司,未經云知聲智能科技股份有限公司;廈門云知芯智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010099456.3/2.html,轉載請聲明來源鉆瓜專利網。





