[發明專利]一種語音采集方法、裝置、設備及存儲介質有效
| 申請號: | 201811213581.1 | 申請日: | 2018-10-18 |
| 公開(公告)號: | CN111081234B | 公開(公告)日: | 2022-03-25 |
| 發明(設計)人: | 洪澤 | 申請(專利權)人: | 珠海格力電器股份有限公司 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;G10L17/00;G10L21/02;G06V40/16;G06V20/10 |
| 代理公司: | 北京同達信恒知識產權代理有限公司 11291 | 代理人: | 黃志華 |
| 地址: | 519070*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 語音 采集 方法 裝置 設備 存儲 介質 | ||
1.一種語音采集方法,其特征在于,所述方法包括:
獲取至少兩個聲源對象的圖像信息,其中,每個聲源對象為能夠輸出語音信息的對象;
按照預設確定規則,從所述至少兩個聲源對象中確定目標聲源對象;
根據所述圖像信息,確定所述目標聲源對象的目標位置;
控制語音采集模塊對所述目標位置的語音信號進行增強采集,以及對所述目標位置外的語音信號進行抑制;
其中,按照預設確定規則,從所述至少兩個聲源對象中確定目標聲源對象,包括:
對所述至少兩個聲源對象的語音信息分別進行語音識別,以獲得每個聲源對象對應的語音內容;
將最早包括預設關鍵詞的語音內容對應的聲源對象確定為所述目標聲源對象;或者,在將最早包括預設關鍵詞的語音內容對應的聲源對象確定為所述目標聲源對象之后,將所述目標聲源對象更新為再次包括所述預設關鍵詞的語音內容對應的聲源對象。
2.如權利要求1所述的方法,其特征在于,按照預設確定規則,從所述至少兩個聲源對象中確定目標聲源對象,包括:
根據獲得圖像信息對所述至少兩個聲源對象進行識別,并將屬于預定對象集合的聲源對象確定為所述目標聲源對象;和/或,
對所述至少兩個聲源對象的語音信息進行聲紋識別,并將聲紋屬于預定聲紋集合的聲源對象確定為所述目標聲源對象。
3.如權利要求2所述的方法,其特征在于,在將聲紋屬于預定聲紋集合的聲源對象確定為所述目標聲源對象之前,所述方法還包括:
獲得每個聲源對象與自身的聲紋特征之間的關聯對應關系。
4.一種語音采集裝置,其特征在于,所述語音采集裝置包括:
獲取模塊,用于獲取至少兩個聲源對象的圖像信息,其中,每個聲源對象為能夠輸出語音信息的對象;
第一確定模塊,用于按照預設確定規則,從所述至少兩個聲源對象中確定目標聲源對象;
第二確定模塊,用于根據所述圖像信息,確定所述目標聲源對象的目標位置;
控制模塊,用于控制語音采集模塊對所述目標位置的語音信號進行增強采集,以及對所述目標位置外的語音信號進行抑制;
其中,所述第一確定模塊用于:
對所述至少兩個聲源對象的語音信息分別進行語音識別,以獲得每個聲源對象對應的語音內容;
將最早包括預設關鍵詞的語音內容對應的聲源對象確定為所述目標聲源對象;或者,
在將最早包括預設關鍵詞的語音內容對應的聲源對象確定為所述目標聲源對象之后,將所述目標聲源對象更新為再次包括所述預設關鍵詞的語音內容對應的聲源對象。
5.一種語音采集設備,其特征在于,所述語音采集設備包括:
存儲器,用于存儲程序指令;
處理器,用于調用所述存儲器中存儲的程序指令,按照獲得的程序指令執行權利要求1-3任一所述的方法包括的步驟;
語音采集模塊,用于根據所述處理器的控制進行語音采集。
6.一種存儲介質,其特征在于,所述存儲介質存儲有計算機可執行指令,所述計算機可執行指令用于使計算機執行權利要求1-3任一所述的方法包括的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于珠海格力電器股份有限公司,未經珠海格力電器股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811213581.1/1.html,轉載請聲明來源鉆瓜專利網。





