[發明專利]一種聲音識別方法及裝置有效
| 申請號: | 201710386789.2 | 申請日: | 2017-05-26 |
| 公開(公告)號: | CN107274913B | 公開(公告)日: | 2020-09-11 |
| 發明(設計)人: | 陳寅之 | 申請(專利權)人: | 廣東美的廚房電器制造有限公司;美的集團股份有限公司 |
| 主分類號: | G10L25/18 | 分類號: | G10L25/18;G10L25/51 |
| 代理公司: | 北京派特恩知識產權代理有限公司 11270 | 代理人: | 張振偉;姚開麗 |
| 地址: | 528315 廣東省佛山市順德區*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 聲音 識別 方法 裝置 | ||
本發明公開了一種聲音識別方法,包括:采集聲音信號,確定所述聲音信號中各脈沖的保持時間;基于所述保持時間計算所述聲音信號的頻率;將所述聲音信號的頻率與預設參考頻率進行對比,確定所述聲音信號的頻率與所述預設參考頻率之間的相似度,將相似度大于預設閾值且最大的預設參考頻率所對應的聲音類型確定為采集的聲音的類型。本發明還同時公開了一種聲音識別裝置。
技術領域
本發明涉及聲音識別技術,尤其涉及一種聲音識別方法及裝置。
背景技術
語音識別的研究工作開始于上世紀50年代,貝爾實驗室開發出了第一個可以識別十個英文數字的語音識別系統,開啟了語音識別的先河。在目前常用的聲音識別的方案中,主要是對人類發出的語音進行識別,識別方法主要是利用基于人工智能技術的語音識別技術,對人類發出的語音進行識別,從而通過語音實現人機交互。
在生活中,除了人類發出的語音之外,還存在著其它形形色色的聲音,例如流水聲、炒菜聲、敲門聲等,人們在做完飯菜后可能會忘記關水龍頭或油煙機,將造成資源的浪費;或者,玻璃杯或瓷器掉落地上,碎片未及時處理可能會傷到人。因此,亟需一種可以識別非人類聲音的技術方案,從而通過識別此類聲音可以進行相應的自動控制或提示。
發明內容
針對上述的技術問題,本發明實施例期望提供一種聲音識別方法及裝置,可以識別除人類語音之外的聲音。
本發明的技術方案是這樣實現的:
本發明實施例提供一種聲音識別方法,所述方法包括:
采集聲音信號,確定所述聲音信號中各脈沖的保持時間;
基于所述保持時間計算所述聲音信號的頻率;
將所述聲音信號的頻率與預設參考頻率進行對比,確定所述聲音信號的頻率與所述預設參考頻率之間的相似度,將相似度大于預設閾值且最大的預設參考頻率所對應的聲音類型確定為采集的聲音的類型。
上述方案中,所述將所述聲音信號的頻率與預設參考頻率進行對比之前,所述方法還包括:對所述聲音信號的頻率進行采樣,得到采樣頻率;
將所述采樣頻率劃分為至少一個頻段;
統計所述至少一個頻段中各頻段內的頻率個數,根據所述頻率個數計算各頻段內的頻率占比,所述頻率占比為各頻段內的頻率個數與采樣所得的頻率總數之間的比值;
所述將所述聲音信號的頻率與預設參考頻率進行對比,確定所述聲音信號的頻率與所述預設參考頻率之間的相似度,包括:
將所述至少一個頻段中各頻段內的所述頻率占比分別與所述預設參考頻率的參考占比進行對比,得到占比相似度;
將所述至少一個頻段中各頻段內的頻率分別與所述預設參考頻率進行對比,得到頻率相似度;
基于所述占比相似度和所述頻率相似度獲得所述相似度。
上述方案中,所述確定所述聲音信號中各脈沖的保持時間,包括:確定所述聲音信號中信號強度大于預設強度所對應的時間,基于所述時間獲得所述聲音信號中各脈沖的保持時間。
上述方案中,所述基于所述保持時間計算所述聲音信號的頻率,包括:對所述保持時間求倒數,將所計算的結果作為所述聲音信號的頻率。
上述方案中,所述將所述采樣頻率劃分為至少一個頻段,包括:基于頻譜識別范圍和頻譜分辨率將所述采樣頻率劃分為至少一個頻段。
本發明實施例還提供了一種聲音識別裝置,所述裝置包括:采集模塊,用于采集聲音信號;
確定模塊,用于確定所述聲音信號中各脈沖的保持時間;
第一計算模塊,用于基于所述保持時間計算所述聲音信號的頻率;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣東美的廚房電器制造有限公司;美的集團股份有限公司,未經廣東美的廚房電器制造有限公司;美的集團股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710386789.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種基于聲音特征的相似度分析方法
- 下一篇:全息方言語音取樣技術





