[實用新型]一種基于聲像耦合的語音采集智能耳機有效
| 申請號: | 202020238832.8 | 申請日: | 2020-03-02 |
| 公開(公告)號: | CN211481445U | 公開(公告)日: | 2020-09-11 |
| 發明(設計)人: | 李清;趙亞非 | 申請(專利權)人: | 科大訊飛股份有限公司 |
| 主分類號: | H04R1/10 | 分類號: | H04R1/10;H04R1/08;H04R3/00;G10L15/25;G10L15/22;G10L21/0216 |
| 代理公司: | 北京維澳專利代理有限公司 11252 | 代理人: | 常小溪;王立民 |
| 地址: | 230088 安徽省*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 聲像 耦合 語音 采集 智能 耳機 | ||
本實用新型提供一種基于聲像耦合的語音采集智能耳機,包括:控制器、語音采集模塊、圖像采集模塊和語音輸出模塊;所述控制器的第一輸入端與所述語音采集模塊的輸出端相連,所述控制器的第二輸入端與所述圖像采集模塊的輸出端相連,所述控制器的輸出端與所述語音輸出模塊的輸入端相連;所述語音采集模塊用于拾取發聲者的語音信號;所述圖像采集模塊用于對發聲者的嘴唇動作進行視頻采集;所述控制器用于對所述語音信號進行降噪處理,并根據所述嘴唇動作對所述語音信號進行聲像耦合,以得到識別后的音頻信號;所述語音輸出模塊用于對外部終端進行所述音頻信號傳輸。本實用新型能提高語音有效識別的準確率,增加智能耳機的智能性。
技術領域
本實用新型涉及語音識別技術領域,尤其涉及一種基于聲像耦合的語音采集智能耳機。
背景技術
在實際場景中,環境中總是充斥了大量的噪聲。為減小環境噪聲對所希望的語音信號的影響,通常需要進行降噪處理。常用的降噪方法有單麥降噪和陣列降噪兩種。單麥降噪通常采用基于統計學的降噪算法,在時域上設計最優濾波器,通常在降低噪聲的同時也會帶來有用信號的損失,因而其使用有一定的局限性。而麥克風陣列降噪算法,則是采用空間濾波器的方式,可以在不損失有用信號的同時,對噪聲進行抑制。
現實生活中有許多場景,需要對人們的說話內容進行采集和準確識別。而現有智能耳機功能較為單一,多只有放音的功能,少數帶有拾音功能的智能耳機,只能簡單的拾取佩戴者的音頻,對拾取到的音頻無法進行降噪處理,在噪聲環境下表現較差。因此,如何對發音者發出的語音進行準確識別具有重要的研究意義。
實用新型內容
本實用新型提供一種基于聲像耦合的語音采集智能耳機,解決現有智能耳機在復雜噪聲環境下,不能準確對語音進行識別,存在降噪效果不好、識別準確率低的問題。能提高語音有效識別的準確率,增加智能耳機的智能性。
為實現以上目的,本實用新型提供以下技術方案:
一種基于聲像耦合的語音采集智能耳機,包括:控制器、語音采集模塊、圖像采集模塊和語音輸出模塊;
所述控制器的第一輸入端與所述語音采集模塊的輸出端相連,所述控制器的第二輸入端與所述圖像采集模塊的輸出端相連,所述控制器的輸出端與所述語音輸出模塊的輸入端相連;
所述語音采集模塊用于拾取發聲者的語音信號;
所述圖像采集模塊用于對發聲者的嘴唇動作進行視頻采集;
所述控制器用于對所述語音信號進行降噪處理,并根據所述嘴唇動作對所述語音信號進行聲像耦合,以得到識別后的音頻信號;
所述語音輸出模塊用于按所述音頻信號輸出語音,及對外部終端進行所述音頻信號傳輸。
優選的,所述語音采集模塊包括:麥克風陣列和自動增益控制單元;
所述自動增益控制單元與所述麥克風陣列信號連接,所述自動增益控制單元的輸出端作為所述語音采集模塊的輸出端;
所述自動增益控制單元用于對所述麥克風陣列產生多通道語音信號進行放大增益的自動調節,以去除各個通道的語音信號的截幅和/或失真。
優選的,圖像采集模塊包括:攝像頭和圖像預處理單元;
所述圖像預處理單元與所述攝像頭信號連接,所述圖像預處理單元的輸出端作為所述圖像采集模塊的輸出端;
所述圖像預處理單元用于根據預設的圖像處理算法對采集的圖像進行嘴唇動作的特征提取。
優選的,所述控制器為SOC片上系統。
優選的,所述語音輸出模塊至少包括以下任一種:藍牙通訊模塊、移動通訊模塊和量子通訊模塊。
優選的,還包括:按鍵;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于科大訊飛股份有限公司,未經科大訊飛股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202020238832.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:利用地線橫擔角鋼作業的地線提線器
- 下一篇:一種新型藍牙話筒





