[發(fā)明專利]一種高精度無線語音識別門禁系統(tǒng)有效
| 申請?zhí)枺?/td> | 201710290060.5 | 申請日: | 2017-04-27 |
| 公開(公告)號: | CN107195028B | 公開(公告)日: | 2018-07-06 |
| 發(fā)明(設(shè)計)人: | 劉恩元 | 申請(專利權(quán))人: | 深圳昌恩智能股份有限公司 |
| 主分類號: | G07C9/00 | 分類號: | G07C9/00;G10L15/22;G10L15/26 |
| 代理公司: | 北京華識知識產(chǎn)權(quán)代理有限公司 11530 | 代理人: | 趙永強 |
| 地址: | 518000 廣東省深圳市鹽田*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 感知哈希 二進制 目標(biāo)語音信號 序列數(shù)據(jù)庫 語音信號處理模塊 語音采集模塊 比特方式 門禁系統(tǒng) 無線語音 語音驗證 驗證 門禁 無線傳輸模塊 采集目標(biāo) 對比驗證 結(jié)果發(fā)送 門禁安全 序列構(gòu)造 語音識別 語音信號 相異 | ||
本發(fā)明提供了一種高精度無線語音識別門禁系統(tǒng),包括語音采集模塊、無線傳輸模塊、語音信號處理模塊、驗證識別模塊、感知哈希序列數(shù)據(jù)庫和門禁,所述語音采集模塊用于采集目標(biāo)語音信號;所述語音信號處理模塊用于將目標(biāo)語音信號進行二進制比特的感知哈希序列構(gòu)造;所述感知哈希序列數(shù)據(jù)庫中預(yù)存有標(biāo)準(zhǔn)的二進制比特方式的感知哈希序列;驗證識別模塊用于將目標(biāo)語音信號的感知哈希序列與感知哈希序列數(shù)據(jù)庫中標(biāo)準(zhǔn)的感知哈希序列進行對比驗證識別,得到語音驗證識別結(jié)果,語音驗證識別結(jié)果發(fā)送至門禁。本發(fā)明采用構(gòu)造二進制比特方式的感知哈希序列對目標(biāo)語音信號進行處理,驗證識別時擴大相異的感知哈希值之間的差距,大大提高語音識別的精確度,從而提高門禁安全性能。
技術(shù)領(lǐng)域
本發(fā)明涉及門禁技術(shù)領(lǐng)域,具體涉及一種高精度無線語音識別門禁系統(tǒng)。
背景技術(shù)
相關(guān)技術(shù)中的門禁系統(tǒng)多為有線傳輸方式,新增布線極為繁瑣,且目前主流的語音識別方法多采用模板匹配法,而采用模板匹配法最大的缺點是需要存儲大量的語音模型,當(dāng)存儲的語音模型達到一定限度時,會發(fā)生語音模型之間可能互相混淆的情況,大大降低識別性能。我們知道音頻是一類重要的多媒體形式,與人類生活息息相關(guān),其主要表現(xiàn)形式主要有音頻、音樂和聲音。在2001年Ton Kalker第一次提出了“感知哈希”的概念,感知哈希是指將在數(shù)據(jù)量的多媒體數(shù)據(jù)映射為長度較小的比特串,并將感知相近的多媒體對象映射成數(shù)學(xué)相近的哈希值,因此感知哈希關(guān)注的是感知的相似性,在音頻驗證方面,將輸入音頻映射成二進制哈希序列,然后將預(yù)先存在的二進制哈希序列進行比較,可以準(zhǔn)確驗證。
在音頻壓縮方面,常常應(yīng)用帶改進的離散余弦變換,所謂改進的離散余弦變換(Modified Discrete Cosine Transform,MDCT)是一種與傅立葉變換相關(guān)的變換,以第四型離散余弦變換(DCT-IV)為基礎(chǔ),重疊性質(zhì)如下:它是應(yīng)用于處理較大的資料集合,當(dāng)連續(xù)的資料區(qū)塊中,當(dāng)前的資料區(qū)塊跟后續(xù)的資料區(qū)塊有重疊到的情形;即當(dāng)前資料區(qū)塊的后半段與下一個資料區(qū)塊的前半段為重疊的狀態(tài)。
在音頻解碼方面,開源解碼器Libmad(MPEG Audio Decoder)是一個開源的高精度MPEG音頻解碼庫,支持MPEG-1(Layer I,Layer II和LayerIII-也就是MP3)。開源解碼器Libmad(MPEG Audio Decoder)提供24-bit的PCM輸出,完全是定點計算,非常適合沒有浮點支持的平臺上使用。使用Libmad提供的一系列API,就可以非常簡單地實現(xiàn)MP3數(shù)據(jù)解碼工作。
非負(fù)矩陣分解是針對非負(fù)的矩陣進行分解降維的概念,最早由兩位科學(xué)家D.D.Lee和H.S.Seung與1999年在《Nature》雜志上提出。非負(fù)矩陣分解通過低秩,對那些都為非負(fù)值得矩陣進行分解。非負(fù)矩陣分解在感知哈希技術(shù)中有著廣泛的應(yīng)用。
發(fā)明內(nèi)容
針對上述問題,本發(fā)明旨在提供一種高精度無線語音識別門禁系統(tǒng)。
本發(fā)明的目的采用以下技術(shù)方案來實現(xiàn):
一種高精度無線語音識別門禁系統(tǒng),包括語音采集模塊、無線傳輸模塊、語音信號處理模塊、驗證識別模塊、感知哈希序列數(shù)據(jù)庫和門禁,所述語音采集模塊用于采集目標(biāo)語音信號;所述語音信號處理模塊用于將目標(biāo)語音信號進行二進制比特的感知哈希序列構(gòu)造;所述感知哈希序列數(shù)據(jù)庫中預(yù)存有標(biāo)準(zhǔn)的二進制比特方式的感知哈希序列;驗證識別模塊用于將目標(biāo)語音信號的感知哈希序列與感知哈希序列數(shù)據(jù)庫中標(biāo)準(zhǔn)的感知哈希序列進行對比驗證識別,得到語音驗證識別結(jié)果,語音驗證識別結(jié)果發(fā)送至門禁。
工作時,需要進出目標(biāo)人員向語音采集模塊發(fā)出目標(biāo)語音信號,無線傳輸模塊將目標(biāo)語音信號發(fā)送至語音信號處理模塊,語音信號處理模塊將目標(biāo)語音信號進行二進制比特方式的感知哈希序列構(gòu)造后發(fā)送到驗證識別模塊,該驗證識別模塊將目標(biāo)語音信號的感知哈希序列與感知哈希序列數(shù)據(jù)庫中標(biāo)準(zhǔn)的感知哈希序列進行對比驗證,如果驗證成功,則綠LED燈亮,門禁打開,如果驗證失敗,則紅LED燈亮,門禁保持關(guān)閉。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳昌恩智能股份有限公司,未經(jīng)深圳昌恩智能股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710290060.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種塑料制粒機擠出料機構(gòu)
- 下一篇:造粒機
- 一種序列號的處理方法及設(shè)備
- 用于評估數(shù)據(jù)庫索引的效率的方法和裝置
- MPP架構(gòu)數(shù)據(jù)庫集群序列系統(tǒng)及序列管理方法
- 用于數(shù)據(jù)庫綁定型應(yīng)用的用戶界面后端集群的擴展方法
- 一種數(shù)據(jù)庫修復(fù)方法、裝置、終端設(shè)備及存儲介質(zhì)
- 一種基于SQL序列的數(shù)據(jù)庫風(fēng)險檢測的方法
- 數(shù)據(jù)庫序列遷移的方法及電子設(shè)備
- 基于負(fù)數(shù)據(jù)庫的相似患者查詢方法及系統(tǒng)
- 服務(wù)質(zhì)量監(jiān)控方法、系統(tǒng)、服務(wù)器和存儲介質(zhì)
- 一種基于本地接口來訪問外部數(shù)據(jù)庫的方法及系統(tǒng)





