[發(fā)明專利]一種基于聲紋識別的監(jiān)控方法及裝置在審
| 申請?zhí)枺?/td> | 201810394740.6 | 申請日: | 2018-04-27 |
| 公開(公告)號: | CN108766439A | 公開(公告)日: | 2018-11-06 |
| 發(fā)明(設計)人: | 吳松海;陳昊亮 | 申請(專利權)人: | 廣州國音科技有限公司 |
| 主分類號: | G10L17/00 | 分類號: | G10L17/00;G10L17/02;G10L15/08;G10L25/51 |
| 代理公司: | 深圳市深佳知識產(chǎn)權代理事務所(普通合伙) 44285 | 代理人: | 王仲凱 |
| 地址: | 510000 廣東省廣州市南沙區(qū)豐澤東路106*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 聲紋識別 監(jiān)控方法及裝置 攝像頭 預警平臺 聲紋 預置 定位信息 光線環(huán)境 獲取圖像 監(jiān)控技術 語音識別 比對 遮擋 匹配 攝像 發(fā)送 監(jiān)控 響應 | ||
1.一種基于聲紋識別的監(jiān)控方法,其特征在于,包括:
S1、獲取監(jiān)聽到的音頻;
S2、對所述監(jiān)聽到的音頻進行語音識別,當所述監(jiān)聽到的音頻中包括預置關鍵詞時,執(zhí)行步驟S3;
S3、對所述監(jiān)聽到的音頻進行聲紋識別,并將所述監(jiān)聽到的音頻對應的第一聲紋與預置聲紋庫中的第二聲紋進行比對,若匹配到相同的聲紋,則發(fā)送定位信息至預警平臺并響應所述預警平臺。
2.根據(jù)權利要求1所述的基于聲紋識別的監(jiān)控方法,其特征在于,所述步驟S1之前還包括:
S01、獲取錄入的音頻;
S02、提取所述錄入的音頻中的第二聲紋并保存至預置聲紋庫中。
3.根據(jù)權利要求2所述的基于聲紋識別的監(jiān)控方法,其特征在于,所述步驟S01之后,所述步驟S02之前還包括:
對所述錄入的音頻中進行語音質(zhì)量檢測,包括:
計算所述錄入的音頻的第一信噪比、第一平均能量值和第一有效語音時長;
依次將所述錄入的音頻的第一信噪比、第一平均能量值和第一有效語音時長與對應的第一預置閾值進行比對,若第一信噪比、第一平均能量值和第一有效語音時長均高于對應的第一預設閾值,則確定所述錄入的音頻的語音質(zhì)量合格,并執(zhí)行下一步,否則提示用戶重新錄入音頻并返回重新獲取錄入的音頻。
4.根據(jù)權利要求3所述的基于聲紋識別的監(jiān)控方法,其特征在于,所述計算所述錄入的音頻的第一信噪比、第一平均能量值和第一有效語音時長之前還包括:
判斷所述錄入的音頻中的內(nèi)容類型,內(nèi)容類型包括隨機數(shù)字、隨機短語、隨機長句和固定短語;
根據(jù)所述錄入的音頻中的內(nèi)容類型確定第一有效語音時長對應的第一預置閾值。
5.根據(jù)權利要求1所述的基于聲紋識別的監(jiān)控方法,其特征在于,所述步驟S3具體包括:
對所述監(jiān)聽到的音頻進行聲紋識別,提取所述監(jiān)聽到的音頻中的第一聲紋;
將所述監(jiān)聽到的音頻中的第一聲紋與預置聲紋庫中的第二聲紋進行比對,得到匹配值;
判斷匹配值是否高于預置匹配閾值,當確定匹配值高于預置匹配閾值時,發(fā)送定位信息至預警平臺并響應所述預警平臺。
6.根據(jù)權利要求5所述的基于聲紋識別的監(jiān)控方法,其特征在于,當匹配值低于預置匹配閾值時,將所述監(jiān)聽到的音頻中的第一聲紋添加至所述預置聲紋庫中,并響應預警平臺。
7.一種基于聲紋識別的監(jiān)控裝置,其特征在于,包括:
第一獲取單元,用于獲取監(jiān)聽到的音頻;
語音識別單元,用于對所述監(jiān)聽到的音頻進行語音識別,當所述監(jiān)聽到的音頻中包括預置關鍵詞時,跳轉(zhuǎn)至聲紋比對單元;
聲紋比對單元,用于對所述監(jiān)聽到的音頻進行聲紋識別,并將所述監(jiān)聽到的音頻對應的第一聲紋與預置聲紋庫中的第二聲紋進行比對,若匹配到相同的聲紋,則發(fā)送定位信息至預警平臺并響應所述預警平臺。
8.根據(jù)權利要求7所述的基于聲紋識別的監(jiān)控裝置,其特征在于,還包括:
第二獲取單元,用于獲取錄入的音頻;
聲紋提取單元,用于提取所述錄入的音頻中的第二聲紋并保存至預置聲紋庫中。
9.根據(jù)權利要求8所述的基于聲紋識別的監(jiān)控裝置,其特征在于,還包括:
語音質(zhì)量檢測單元,用于對所述錄入的音頻中進行語音質(zhì)量檢測;
所述語音質(zhì)量檢測單元包括:
計算子單元,用于計算所述錄入的音頻的第一信噪比、第一平均能量值和第一有效語音時長;
比對子單元,用于依次將所述錄入的音頻的第一信噪比、第一平均能量值和第一有效語音時長與對應的第一預置閾值進行比對,若第一信噪比、第一平均能量值和第一有效語音時長均高于對應的第一預設閾值,則確定所述錄入的音頻的語音質(zhì)量合格,并執(zhí)行下一步,否則提示用戶重新錄入音頻并返回重新獲取錄入的音頻。
10.根據(jù)權利要求9所述的基于聲紋識別的監(jiān)控裝置,其特征在于,語音質(zhì)量檢測單元還包括:
判斷子單元,用于判斷所述錄入的音頻中的內(nèi)容類型,內(nèi)容類型包括隨機數(shù)字、隨機短語、隨機長句和固定短語;
閾值確定子單元,用于根據(jù)所述錄入的音頻中的內(nèi)容類型確定第一有效語音時長對應的第一預置閾值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州國音科技有限公司,未經(jīng)廣州國音科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810394740.6/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 一種優(yōu)化環(huán)境的監(jiān)控產(chǎn)品裝置及方法
- 一種基站防盜監(jiān)控方法及裝置
- 用于監(jiān)控系統(tǒng)運行狀態(tài)的裝置及方法
- 用電預警監(jiān)控系統(tǒng)及方法
- 監(jiān)控裝置預置位設置、切換方法及系統(tǒng)
- 監(jiān)控視圖展示方法及裝置
- 光模塊的監(jiān)控數(shù)據(jù)處理方法、裝置及光模塊
- 電池滾壓監(jiān)控方法及裝置
- 監(jiān)控數(shù)據(jù)處理方法、裝置及監(jiān)控系統(tǒng)
- 監(jiān)控方法、監(jiān)控裝置、監(jiān)控系統(tǒng)及計算機可讀存儲介質(zhì)





