[發明專利]語音控制方法、裝置、電子設備及存儲介質在審
| 申請號: | 202011039429.3 | 申請日: | 2020-09-28 |
| 公開(公告)號: | CN112164396A | 公開(公告)日: | 2021-01-01 |
| 發明(設計)人: | 周毅;左聲勇;殷切;陳真 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;G10L21/10 |
| 代理公司: | 北京同立鈞成知識產權代理有限公司 11205 | 代理人: | 張娜;臧建明 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 控制 方法 裝置 電子設備 存儲 介質 | ||
1.一種語音控制方法,包括:
獲取音頻信號流;
對所述音頻信號流進行能量估計,確定所述音頻信號流中每幀音頻信號的能量值;
根據所述音頻信號流中每幀音頻信號的能量值,在語音交互界面上動態顯示所述音頻信號流的能量值。
2.根據權利要求1所述的方法,其特征在于,所述根據所述音頻信號流中每幀音頻信號的能量值,在語音交互界面上動態顯示所述音頻信號流的能量值,包括以下至少一種:
在語音交互界面上顯示的聲波圖形大小,跟隨每幀音頻信號的能量值大小變換;
在語音交互界面上顯示的聲波圖形顏色,跟隨每幀音頻信號的能量值大小變換。
3.根據權利要求2所述的方法,在所述根據所述音頻信號流中每幀音頻信號的能量值,在語音交互界面上動態顯示所述音頻信號流的能量值之前,還包括:
確定所述音頻信號流對應的語音采集裝置;
根據所述語音采集裝置的屬性信息,將所述語音采集裝置在所述語音交互界面上的圖標位置確定為所述音頻信號流在語音交互界面上的顯示位置。
4.根據權利要求1-3任一項所述的方法,在所述獲取音頻信號流之后,還包括:
在所述語音交互界面上顯示等待框,所述等待框用于指示所述音頻信號流正處于被處理狀態。
5.根據權利要求1-3任一項所述的方法,所述對所述音頻信號流進行能量估計,確定所述音頻信號流中每幀音頻信號的能量值,包括:
對所述音頻信號流進行預處理,得到所述音頻信號流包括的多幀音頻信號,所述預處理包括如下至少一種:濾波降噪、信號分幀;
對所述音頻信號流包括的每幀音頻信號進行幅頻分析,計算出所述音頻信號流中每幀音頻信號的能量值。
6.根據權利要求1所述的方法,還包括:
若所述音頻信號流的時長小于能夠被識別的最短時長,則輸出提示信息。
7.根據權利要求1所述的方法,還包括:
若每幀音頻信號的能量值小于能夠被識別的最小能量閾值,或者,大于最大健康分貝閾值,則輸出提示信息。
8.根據權利要求6或7所述的方法,所述提示信息為語音提示信息,和/或,為疊加在所述音頻信號流對應的語音采集裝置圖標位置上的文字提示信息。
9.根據權利要求1-3任一項所述的方法,在所述方法應用于車載終端時,所述方法還包括:
控制車輛內氛圍燈的顏色,跟隨每幀音頻信號的能量值大小變換。
10.一種語音控制裝置,包括:
獲取模塊,用于獲取音頻信號流;
處理模塊,用于對所述音頻信號流進行能量估計,確定所述音頻信號流中每幀音頻信號的能量值;
控制模塊,用于根據所述音頻信號流中每幀音頻信號的能量值,在語音交互界面上動態顯示所述音頻信號流的能量值。
11.一種電子設備,包括:
至少一個處理器;以及
與所述至少一個處理器通信連接的存儲器;其中,
所述存儲器存儲有可被所述至少一個處理器執行的指令,所述指令被所述至少一個處理器執行,以使所述至少一個處理器能夠執行權利要求1-9中任一項所述的方法。
12.一種存儲有計算機指令的非瞬時計算機可讀存儲介質,所述計算機指令用于使所述計算機執行權利要求1-9中任一項所述的方法。
13.一種語音控制方法,包括:
確定獲取到的音頻信號流中每幀音頻信號的能量值;
在語音交互界面上顯示所述音頻信號流中每幀音頻信號的能量值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011039429.3/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種建筑工地用霧炮機及使用方法
- 下一篇:一種高效的手部消毒機





