[發明專利]一種基于多麥克風陣列節點的分布式語音喚醒系統有效
| 申請號: | 202110346067.0 | 申請日: | 2021-03-31 |
| 公開(公告)號: | CN113129905B | 公開(公告)日: | 2022-10-04 |
| 發明(設計)人: | 廖奎華 | 申請(專利權)人: | 深圳魚亮科技有限公司 |
| 主分類號: | G10L17/24 | 分類號: | G10L17/24;G10L17/02;G10L17/04;G10L17/20;G10L17/22 |
| 代理公司: | 合肥律眾知識產權代理有限公司 34147 | 代理人: | 殷娟 |
| 地址: | 518101 廣東省深圳市寶安區*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 麥克風 陣列 節點 分布式 語音 喚醒 系統 | ||
本發明公開了一種基于多麥克風陣列節點的分布式語音喚醒系統,具體涉及語音喚醒系統領域,包括依次相連的客戶端、資源管理服務器和識別服務器,所述客戶端還連接有用于捕獲喚醒語音的麥克風陣列,麥克風陣列由多個麥克風分布式排列組成,所述識別服務器還連接有聲音處理模塊,用于對喚醒語音進行識別和處理;所述聲音處理模塊包括與識別服務器連接的聲音信道。本發明通過設定一定數量的麥克風陣列,獲取語音喚醒系統中的喚醒關鍵詞,對系統進行喚醒,能大幅度提升語音喚醒系統的效率,在不同的使用環境下也可保證系統喚醒的幾率,降低出現喚醒失誤的現象,提升了系統的實用性。
技術領域
本發明涉及語音喚醒系統領域,更具體地說,本發明涉及一種基于多麥克風陣列節點的分布式語音喚醒系統。
背景技術
語音識別指代通過分析語音信號并將分析的語音信號與構圖的數據庫組合,將語音信號轉換為字符串或識別語言含義內容。
在語音識別技術中,語音識別模型分析輸入的語音數據,提取特征,并測量與先前收集的語音模型數據庫的相似性,以將最相似的一個轉換為文本或命令。
語音識別技術是一種模式識別過程。因為每個人的語音、發音和語調不同,所以傳統的語音識別技術會從盡可能多的人中收集語音數據,從中提取共同特征,并生成參考模式。
然而,現有的語音識別系統在進行喚醒時,其語音獲取途徑單一,不能獲取有效的喚醒命令,導致系統喚醒的成功率不一。在不同的使用環境下具有很大的偏差,實用性低。
發明內容
為實現上述目的,本發明提供如下技術方案:一種基于多麥克風陣列節點的分布式語音喚醒系統,包括依次相連的客戶端、資源管理服務器和識別服務器,所述客戶端還連接有用于捕獲喚醒語音的麥克風陣列,麥克風陣列由多個麥克風分布式排列組成,所述識別服務器還連接有聲音處理模塊,用于對喚醒語音進行識別和處理;
所述聲音處理模塊包括與識別服務器連接的聲音信道,所述聲音信道連接有端點檢測、特征提取、聲學模型、語音模型和識別搜索。
在一個優選地實施方式中,所述客戶端向資源管理服務器發送連接請求,所述資源管理服務器從所有的識別服務器中尋找一個空閑的,然后向該識別服務器發送分配請求。
在一個優選地實施方式中,所述識別服務區尋找一個空閑的連接,回應分配成功消息給資源管理服務服務器,所述資源管理服務器把識別服務器的信息回應給客戶端。
在一個優選地實施方式中,所述客戶端與識別服務區建立連接,開始識別操作。
在一個優選地實施方式中,所述麥克風陣列采集的喚醒語音信息通過客戶端發送至識別服務器,并通過聲音信道進入至聲音處理模塊中。
在一個優選地實施方式中,所述端點檢測接收喚醒語音信息,將語音信息聲音幀中兩端端點處的雜音、靜音和起始段刪除,生成喚醒語音幀段;
所述特征提取用于從喚醒語音幀段中提取包含喚醒詞的特征段;
所述聲學模型具體為采用語音訓練模型生成的喚醒模型,為特征提取獲得的特征段提供對比樣本,判斷喚醒詞是否復合喚醒標準;
所述識別搜索用于從聲學模型中獲取與特征。
本發明的技術效果和優點:
通過設定一定數量的麥克風陣列,獲取語音喚醒系統中的喚醒關鍵詞,對系統進行喚醒,能大幅度提升語音喚醒系統的效率,在不同的使用環境下也可保證系統喚醒的幾率,降低出現喚醒失誤的現象,提升了系統的實用性。
附圖說明
圖1為本發明的系統框架結構示意圖。
具體實施方式
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳魚亮科技有限公司,未經深圳魚亮科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110346067.0/2.html,轉載請聲明來源鉆瓜專利網。





