[發明專利]一種聲音喚醒方法及系統在審
| 申請號: | 201410211795.0 | 申請日: | 2014-05-20 |
| 公開(公告)號: | CN103956164A | 公開(公告)日: | 2014-07-30 |
| 發明(設計)人: | 王艷龍;陳楠昕;俞凱;周偉達 | 申請(專利權)人: | 蘇州思必馳信息科技有限公司;上海交通大學 |
| 主分類號: | G10L15/02 | 分類號: | G10L15/02;G10L15/06 |
| 代理公司: | 北京科億知識產權代理事務所(普通合伙) 11350 | 代理人: | 湯東鳳 |
| 地址: | 215123 江蘇省蘇州*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 聲音 喚醒 方法 系統 | ||
技術領域
本發明涉及聲音識別技術領域,特別涉及一種聲音喚醒方法及系統。
背景技術
近些年來,隨著語音識別技術的快速發展,喚醒技術在諸多語音系統中得到了應用,例如:車載導航、手機語音助手等。傳統的語音喚醒技術需要耗費電量做聲音方面的大量計算,或是通過按鈕等方法控制,在遠程控制等復雜環境中難以騰出手來操作,具有諸多不便。而此類產品在現實生活中又具有諸多應用,例如樓道中的聲控燈、聲控解鎖等。這類產品其中一些能做到省電,卻容易受到外界環境干擾,例如樓道中的聲控燈會因為樓上或樓下聲音的干擾而自動開啟,在實際生活中效果不佳。又例如通過對用戶的一些特殊語句進行識別(例如“開始”等等)來喚醒系統,但是對于這類語句的識別復雜度較高,需要提取高階特征,做復雜訓練,構造聲學模型,計算量較大,使得耗電量上升,在很多條件下難以推廣使用??紤]到一個好的喚醒模塊能夠使整個語音系統在大部分時間處于偽待機狀態,即除了喚醒模塊其他模塊關閉,改進現有技術對整個語音系統有較大意義。
發明內容
為了解決現有技術的問題,本發明實施例提供了一種聲音喚醒系統及方法。所述技術方案如下:
一方面,提供了一種聲音喚醒方法,所述方法包括:
當檢測到外界聲音時,啟動聲音喚醒系統;
采集外界聲音,提取所述外界聲音的音頻特征;
當預設規則庫中包含所述外界聲音的音頻特征時,傳遞預設聲音出現信號,所述預設規則庫包含多個人體聲音特征;
統計預設時間內所述外界聲音出現次數,并根據所統計的次數執行相應的指令。
另一方面,提供了一種聲音喚醒系統,所述系統包括:預處理模塊、音頻輸入模塊、特征提取模塊、音頻分析模塊、解碼模塊;其中,
所述預處理模塊用于當檢測到外界聲音時,啟動所述音頻輸入模塊、所述特征提取模塊、所述音頻分析模塊及所述解碼模塊;
所述音頻輸入模塊用于采集外界聲音;
所述特征提取模塊用于提取外界聲音的音頻特征;
所述音頻分析模塊,用于當預設規則庫中包含所述外界聲音的音頻特征時,傳遞預設聲音出現信號,所述預設規則庫包含多個人體聲音特征;
所述解碼模塊用于統計預設時間內所述外界聲音出現次數,并根據所統計的次數執行相應的指令。
本發明實施例提供的技術方案帶來的有益效果是:
通過檢測外界聲音,當外界聲音非靜音時,啟動聲音喚醒系統,當判斷外界聲音為預設聲音時,根據預設聲音出現的次數執行相應指令,使得該聲音喚醒系統具有較好的魯棒性,根據預設聲音執行相應指令,準確率較高,資源消耗相對較低節,省電源消耗。
附圖說明
為了更清楚地說明本發明實施例中的技術方案,下面將對實施例描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發明的一些實施例,對于本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以根據這些附圖獲得其他的附圖。
圖1是本發明實施例提供的聲音喚醒方法流程圖;
圖2是本發明實施例提供的聲音喚醒系統結構示意圖;
圖3是本發明實施例提供的聲音喚醒方法流程圖。
具體實施方式
為使本發明的目的、技術方案和優點更加清楚,下面將結合附圖對本發明實施方式作進一步地詳細描述。
圖1是本發明實施例提供的聲音喚醒方法流程圖。參見圖1,該實施例包括
101、當檢測到外界聲音時,啟動聲音喚醒系統;
在本發明實施例中,可以采用聲音強度檢測器檢測外界聲音,當檢測到外界聲音時,啟動聲音喚醒系統,當未檢測到外界聲音時,不啟動聲音喚醒系統。也即是在附近無人時,不啟動聲音喚醒系統,待有人時,才啟動聲音喚醒系統,可以大大減少電量的消耗。
102、采集外界聲音,并對所采集的外界聲音進行端點檢測,確定所采集的外界聲音是否靜音;
在本發明實施例中,采集外界聲音,并用所采集的外界聲音最為簡單的特征如音量、頻率、音高等進行端點檢測,排除靜音等情況。
103、當所采集的外界聲音非靜音時,對該外界聲音進行短時快速傅里葉變化,提取該外界聲音的音頻特征;
104、當預設規則庫中包含該外界聲音的音頻特征時,傳遞預設聲音出現信號,該預設規則庫包含多個人體聲音特征;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘇州思必馳信息科技有限公司;上海交通大學,未經蘇州思必馳信息科技有限公司;上海交通大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410211795.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種家用水井濾管
- 下一篇:進氣系統及基片處理設備





