[發明專利]基于音頻頻域特征的對話過程捂嘴手勢識別方法有效
| 申請號: | 202011131535.4 | 申請日: | 2020-10-21 |
| 公開(公告)號: | CN112259124B | 公開(公告)日: | 2021-06-15 |
| 發明(設計)人: | 喻純;李竹 | 申請(專利權)人: | 交互未來(北京)科技有限公司 |
| 主分類號: | G10L25/51 | 分類號: | G10L25/51;G06F3/16;G06F21/32;H04R1/08;H04R1/10 |
| 代理公司: | 北京君莫知識產權代理事務所(普通合伙) 11715 | 代理人: | 崔云鶴 |
| 地址: | 100015 北京市朝陽區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 音頻 特征 對話 過程 手勢 識別 方法 | ||
1.一種基于音頻頻域特征的對話過程捂嘴手勢識別方法,所述方法應用于基于語音接收組件和移動終端實現的語音輸入過程,其特征在于,
所述方法包括如下步驟:
S1:建立所述語音接收組件與所述移動終端的無線通信;
S2:響應于所述移動終端開啟語音輸入的操作,所述語音接收組件通過第一語音監測通道和第二語音監測通道接收語音輸入信號;
S3:所述第一語音監測通道將接收的第一語音輸入信號發送至所述移動終端;
S4:所述移動終端基于內置的聲紋識別模型判斷當前語音輸入是否為授權用戶輸入;
如果是,則進入步驟S5;
如果否,則返回步驟S2;
S5:所述第二語音監測通道將接收的第二語音輸入信號發送至所述移動終端;
S6:所述移動終端基于所述第一語音輸入信號和所述第二語音輸入信號各自的音頻頻域特征比對,進行所述捂嘴手勢識別;
其中,所述步驟S6進一步包括:
提取出所述第一語音輸入信號和所述第二語音輸入信號各自包含用戶語音的片段;
計算所述第一語音輸入信號和所述第二語音輸入信號各自包含用戶語音的片段的遷移函數,將所述遷移函數的參數值作為表征音頻信號通路差別的特征值;
將上述特征值輸入到經數據訓練后的機器學習模型中,模型輸出判別用戶當前是否維持捂嘴手勢。
2.如權利要求1所述的一種基于音頻頻域特征的對話過程捂嘴手勢識別方法,其特征在于:
所述移動終端包括手機、平板電腦、可穿戴設備之一或者其組合;
所述語音接收組件包括單耳耳機。
3.如權利要求1所述的一種基于音頻頻域特征的對話過程捂嘴手勢識別方法,其特征在于:
所述步驟S4中所述移動終端基于內置的聲紋識別模型判斷當前語音輸入是否為授權用戶輸入,具體包括:
預先在所述移動終端中注冊授權用戶正常狀態下的聲紋特征信號;
將所述第一語音輸入信號進行音頻頻域特征處理后,得到多個音頻頻域特征;
判斷所述音頻頻域特征與所述聲紋特征信號是否滿足匹配條件,如果滿足,則所述當前語音輸入為授權用戶輸入。
4.如權利要求3所述的一種基于音頻頻域特征的對話過程捂嘴手勢識別方法,其特征在于:
將所述第一語音輸入信號進行音頻頻域特征處理后,得到多個音頻頻域特征,具體包括如下步驟:
S41:通過高通濾波器對所述第一語音輸入信號進行預加重處理,所述高通濾波器的傳遞函數為:H(z)=1-αz-1,其中,0<α<1;z為傳遞函數變量;
S42:采用滑動時間窗口對所述進行預加重處理后的第一語音輸入信號進行分幀;
所述滑動時間窗口函數表達式如下:
N為每一幀的長度;
S43:采用譜減法對所述分幀后的序列進行去噪;
S44:對所述去噪后的序列進行端點檢測,獲取每兩個相鄰端點之間的音頻頻域特征。
5.如權利要求1所述的一種基于音頻頻域特征的對話過程捂嘴手勢識別方法,其特征在于:
所述步驟S6中所述移動終端基于所述第一語音輸入信號和所述第二語音輸入信號各自的音頻頻域特征比對,進行所述捂嘴手勢識別,具體包括如下步驟:
S61:通過人聲檢測算法(Voice Acticity Dection)提取出所述第一語音輸入信號和所述第二語音輸入信號各自包含用戶語音的片段;
S62:將所述第一語音輸入信號和所述第二語音輸入信號各自包含用戶語音的片段對齊;
S63:通過傅里葉變換和梅爾倒譜計算方法提取表征音頻片段頻率特征的特征值,并對于音頻片段的平均幅度進行計算;
S64:比較兩路音頻上述特征的差異,若音量差異以及頻率差異超過一定閾值,則判定為用戶在語音輸入的同時維持了朝向麥克的捂嘴手勢。
6.如權利要求4所述的一種基于音頻頻域特征的對話過程捂嘴手勢識別方法,
其特征在于:
所述步驟S42采用滑動時間窗口對所述進行預加重處理后的第一語音輸入信號進行分幀后,相鄰幀序列重疊的序列長度D滿足如下條件:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于交互未來(北京)科技有限公司,未經交互未來(北京)科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011131535.4/1.html,轉載請聲明來源鉆瓜專利網。





