[發明專利]基于脈沖神經網絡的語音喚醒方法、裝置及電子設備在審
| 申請號: | 202110581302.2 | 申請日: | 2021-05-26 |
| 公開(公告)號: | CN113160823A | 公開(公告)日: | 2021-07-23 |
| 發明(設計)人: | 肖揚;羅濤;施佳子;于海燕 | 申請(專利權)人: | 中國工商銀行股份有限公司 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;G10L15/08;G10L25/18;G10L25/24;G10L25/27;G10L25/30;G10L25/45 |
| 代理公司: | 中科專利商標代理有限責任公司 11021 | 代理人: | 李春偉 |
| 地址: | 100140 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 脈沖 神經網絡 語音 喚醒 方法 裝置 電子設備 | ||
本公開提供了一種基于脈沖神經網絡的語音喚醒方法、裝置及電子設備,可應用于金融領域或其他領域。其中,脈沖神經網絡包括特征提取層、學習分類層以及輸出層,語音喚醒方法包括:獲取語音信號,語音信號包括具有開始點和結束點的聲波信號;通過特征提取層對語音信號進行特征提取,得到脈沖序列;通過學習分類層對脈沖序列進行分類,得到分類結果,并通過輸出層輸出分類結果;以及基于分類結果判斷是否喚醒目標設備。
技術領域
本公開涉及人工智能技術領域,更具體地,涉及一種基于脈沖神經網絡的語音喚醒方法、裝置、電子設備及計算機可讀存儲介質。
背景技術
隨著人工智能、自動控制等技術的快速發展,帶有語音控制的設備越來越多的應用到工農業生產、建筑、物流、和日常生活等諸多領域,很多帶有語音功能的設備都需要語音喚醒技術作為人和機器互動的開始或入口。一般來說,語音喚醒技術需要長時間保持設備處于待機狀態。相關技術中的智能設備均采用的是傳統芯片,并且需要傳統芯片保持“休眠-喚醒”處于較高的頻率,避免丟失隨時可能發生的事件,當傳統芯片的“休眠-喚醒”處于較高頻率時,設備耗電嚴重,導致嚴重的功耗浪費。
發明內容
有鑒于此,本公開提供了一種基于脈沖神經網絡的語音喚醒方法、裝置、電子設備及計算機可讀存儲介質。
本公開的第一方面提供了一種基于脈沖神經網絡的語音喚醒方法,其中,所述脈沖神經網絡包括特征提取層、學習分類層以及輸出層,所述語音喚醒方法包括:獲取語音信號,所述語音信號包括具有開始點和結束點的聲波信號;通過所述特征提取層對所述語音信號進行特征提取,得到脈沖序列;通過學習分類層對所述脈沖序列進行分類,得到分類結果,并通過所述輸出層輸出所述分類結果;以及基于所述分類結果判斷是否喚醒目標設備。
根據本公開的實施例,所述特征提取層包括預處理層、第一特征提取層以及第二特征提取層。
根據本公開的實施例,所述通過所述特征提取層對所述語音信號進行特征提取,得到脈沖序列包括:使用所述預處理層對所述語音信號進行預處理,得到時域信號;使用所述第一特征提取層對所述時域信號進行特征提取,得到梅爾頻率信息;以及使用所述第二特征提取層對所述梅爾頻率信息進行特征提取,得到所述脈沖序列。
根據本公開的實施例,所述使用所述預處理層對所述語音信號進行預處理,得到時域信號包括:采用一階類高通濾波器對所述語音信號進行預加重處理,以提高所述語音信號中的高頻部分;以及在所述預加重處理之后,對所述語音信號進行分幀,得到語音信號幀,使用窗函數對所述語音信號幀加窗處理,得到所述時域信號。
根據本公開的實施例,所述使用所述第一特征提取層對所述時域信號進行特征提取,得到梅爾頻率信息包括:獲取所述時域信號,對所述時域信號與所述窗函數的乘積進行短時傅里葉變換,以將所述時域信號轉換為頻域信號;將所述頻域信號在時間上進行堆疊,以生成頻譜圖,其中,所述頻譜圖包含頻率信息;以及將至少一個梅爾濾波器組應用于所述頻譜圖中,以將所述頻譜圖中的頻率信息轉換為梅爾頻率信息。
根據本公開的實施例,所述使用所述第一特征提取層對所述時域信號進行特征提取,得到梅爾頻率信息還包括:得到所述梅爾頻率信息后,計算所述至少一個梅爾濾波器組中的每一個輸出的對數能量。
根據本公開的實施例,所述使用所述第二特征提取層對所述梅爾頻率信息進行特征提取,得到所述脈沖序列包括:通過時滯編碼方式對所述梅爾頻率信息進行編碼,以將所述梅爾頻率轉換為脈沖信息;以及通過K-SVD算法獲得所述脈沖信息的字典,計算所述脈沖信息局部信息與所述字典之間的距離,通過所述距離確定最佳匹配碼本,通過所述最佳匹配碼本將所述脈沖信息轉換為所述脈沖序列。
根據本公開的實施例,所述基于所述分類結果判斷是否喚醒目標設備包括:若所述分類結果與多個預設關鍵詞中的至少一個屬于同一類別,則喚醒所述目標設備;以及若所述分類結果與多個預設關鍵詞中每一個屬于不同類別,則不喚醒所述目標設備。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國工商銀行股份有限公司,未經中國工商銀行股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110581302.2/2.html,轉載請聲明來源鉆瓜專利網。





