[發明專利]語音拾取裝置及多媒體設備有效
| 申請號: | 201710423629.0 | 申請日: | 2017-06-07 |
| 公開(公告)號: | CN107123423B | 公開(公告)日: | 2021-05-18 |
| 發明(設計)人: | 于豪 | 申請(專利權)人: | 微鯨科技有限公司 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;G10L15/20;G06K9/00 |
| 代理公司: | 北京超凡志成知識產權代理事務所(普通合伙) 11371 | 代理人: | 蘇勝 |
| 地址: | 201210 上海市浦東*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 拾取 裝置 多媒體設備 | ||
1.一種語音拾取裝置,其特征在于,所述裝置包括:
用于采集圖像的圖像采集單元;
與所述圖像采集單元電性連接,用于對圖像采集單元采集到的圖像進行人臉識別的人臉識別單元;
用于采集語音信號的語音采集單元;
與所述語音采集單元連接,用于調整所述語音采集單元朝向的轉向調整單元;及
與所述圖像采集單元、人臉識別單元、語音采集單元、轉向調整單元電性連接的處理控制單元;
所述處理控制單元在所述人臉識別單元識別到所述圖像采集單元采集的圖像中存在人臉時,控制所述轉向調整單元的運行以使所述語音采集單元對準圖像中人臉所在的方位,并控制所述語音采集單元對人臉所在方位的語音信號進行采集;
所述處理控制單元具體用于在所述人臉識別單元識別到所述圖像采集單元采集的圖像中存在人臉時,對識別到的人臉的面部信息進行處理,得到所述人臉中嘴部對應的方位,并根據所述嘴部對應的方位控制所述轉向調整單元,使所述語音采集單元對準所述嘴部對應的方位進行語音信號的采集;
所述處理控制單元在所述人臉識別單元識別到的人臉的數目為多個時,獲得各個人臉對應的控制權限,控制所述轉向調整單元帶動所述語音采集單元朝向控制權限最高的人臉所在的方位,以對所述人臉所在方位的語音信號進行采集。
2.根據權利要求1所述的裝置,其特征在于,所述裝置還包括用于對所述裝置周邊環境中的噪聲信號進行采集的噪聲采集單元;
所述處理控制單元與所述噪聲采集單元電性連接,以根據所述噪聲采集單元采集到的噪聲信號對所述語音采集單元采集到的語音信號進行除噪處理,得到除噪后的語音信息。
3.根據權利要求2所述的裝置,其特征在于,所述裝置還包括用于進行數據交互的網絡通信單元;
所述網絡通信單元與所述處理控制單元電性連接,所述裝置通過所述網絡通信單元與服務器通信連接,以將所述處理控制單元得到的除噪后的語音信息發送給所述服務器進行語音識別,或接收服務器對除噪后的語音信息進行語音識別后得到的控制指令。
4.根據權利要求2所述的裝置,其特征在于,所述裝置還包括用于進行語音識別的語音識別單元;
所述語音識別單元與所述處理控制單元電性連接,以對所述處理控制單元得到的除噪后的語音信息進行語音識別,得到對應的控制指令。
5.根據權利要求2所述的裝置,其特征在于,所述語音采集單元包括至少一個語音取樣傳聲器,所述噪聲采集單元包括至少一個噪聲取樣傳聲器,至少一個所述語音取樣傳聲器配合至少一個所述噪聲取樣傳聲器形成一傳聲器陣列,以分別對人臉所在方位的語音信號和所述語音拾取裝置周邊環境中的噪聲信號進行采集。
6.根據權利要求2所述的裝置,其特征在于,所述處理控制單元包括音頻處理子單元;
所述音頻處理子單元用于對所述噪聲采集單元采集到的噪聲信號和所述語音采集單元采集到的語音信號進行放大處理后,并將放大后的噪聲信號進行反相處理后與放大后的語音信號進行混合疊加,以消除所述語音信號中的噪聲信號,得到除噪后的語音信息。
7.根據權利要求1所述的裝置,其特征在于,所述裝置還包括與所述圖像采集單元連接,用于控制所述圖像采集單元的圖像采集方向的轉動控制單元。
8.一種多媒體設備,其特征在于,所述多媒體設備包括權利要求1-7中任意一項所述的語音拾取裝置,所述多媒體設備對所述語音拾取裝置采集到的語音信號進行語音識別,得到與所述語音信號匹配的控制指令,并根據所述控制指令執行相應的操作。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于微鯨科技有限公司,未經微鯨科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710423629.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:無人機定位語音分布式控制方法
- 下一篇:音頻文件處理方法及裝置





