[發明專利]飲水機的語音控制方法及裝置有效
| 申請號: | 202011486701.2 | 申請日: | 2020-12-16 |
| 公開(公告)號: | CN112466305B | 公開(公告)日: | 2022-09-02 |
| 發明(設計)人: | 陳進 | 申請(專利權)人: | 思必馳科技股份有限公司 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;G05B19/042 |
| 代理公司: | 北京商專永信知識產權代理事務所(普通合伙) 11400 | 代理人: | 黃謙;車江華 |
| 地址: | 215123 江蘇省蘇州市蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 飲水機 語音 控制 方法 裝置 | ||
1.一種飲水機的語音操控方法,包括:
基于飲水機中的音頻采集模塊,全向采集初始音頻數據;
基于所述初始音頻數據中說話人相對于所述飲水機的用戶方位對所述初始音頻數據進行優化處理,以得到相應的目標音頻數據;
基于所述目標音頻數據,對所述飲水機執行相應的操控操作,
其中,所述基于所述初始音頻數據中說話人相對于所述飲水機的用戶方位對所述初始音頻數據進行優化處理,以得到相應的目標音頻數據,包括:
對所述初始音頻數據中對應所述用戶方位的音頻分量進行增強處理,并對所述初始音頻數據中對應在所述用戶方位之外的音頻分量進行抑制處理,以得到相應的第一音頻數據;
根據所述第一音頻數據,確定相應的目標音頻數據,
其中,所述音頻采集模塊為多通道音頻采集模塊,以及所述初始音頻數據包括對應多個通道的音頻信息;
其中,所述根據所述第一音頻數據,確定相應的目標音頻數據,包括:
獲取所述第一音頻數據中對應各個通道的音頻信息的能量值;
根據所獲取的各個通道的能量值,從對應所述各個通道的音頻信息中確定目標音頻信息;
根據所述目標音頻信息,確定相應的目標音頻數據,
其中,所述初始音頻數據為對應多個時間點的音頻數據,
其中,所述根據所獲取的各個通道的能量值,從對應所述各個通道的音頻信息中確定目標音頻信息,包括:
針對各個所述時間點,根據所獲取的各個通道的能量值,從對應所述各個通道的音頻信息中確定對應所述時間點的目標音頻信息;
相應地,所述根據所述目標音頻信息,確定相應的目標音頻數據,包括:
聚合對應所述各個時間點的目標音頻信息,以得到相應的目標音頻數據。
2.根據權利要求1所述的方法,其中,所述對所述初始音頻數據中對應所述用戶方位的音頻分量進行增強處理,并對所述初始音頻數據中對應在所述用戶方位之外的音頻分量進行抑制處理,以得到相應的第一音頻數據,包括:
在多個預設的方位角范圍中,確定與所述用戶方位匹配的目標方位角范圍;
針對所述初始音頻數據在所述目標方位角范圍中的音頻分量進行增強處理,以及針對所述初始音頻數據在所述目標方位角范圍之外的音頻分量進行抑制處理,以得到相應的第一音頻數據。
3.根據權利要求1所述的方法,其特征在于,所述基于所述目標音頻數據,對所述飲水機執行相應的操控操作,包括:
識別所述目標音頻數據所對應的內容信息中是否存在喚醒關鍵詞;
當所述內容信息中存在喚醒關鍵詞時,基于所述目標音頻數據對所述飲水機執行相應的操控操作。
4.根據權利要求3所述的方法,其特征在于,所述基于所述目標音頻數據對所述飲水機執行相應的操控操作,包括:
基于所述目標語音數據,觸發所述飲水機在設定時間段內采集操控語音數據;
基于所述操控語音數據所對應的操控指令,對所述飲水機執行相應的操控操作。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于思必馳科技股份有限公司,未經思必馳科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011486701.2/1.html,轉載請聲明來源鉆瓜專利網。





