[發明專利]一種數字串語音識別方法、身份驗證裝置及計算機可讀存儲介質有效
| 申請號: | 202010224785.6 | 申請日: | 2020-03-26 |
| 公開(公告)號: | CN111429913B | 公開(公告)日: | 2023-03-31 |
| 發明(設計)人: | 曾志先;肖龍源;李稀敏;葉志堅;劉曉葳 | 申請(專利權)人: | 廈門快商通科技股份有限公司 |
| 主分類號: | G10L15/26 | 分類號: | G10L15/26;G10L15/06;G10L17/00 |
| 代理公司: | 廈門仕誠聯合知識產權代理事務所(普通合伙) 35227 | 代理人: | 吳圳添 |
| 地址: | 361009 福建省廈門市*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 種數 字串 語音 識別 方法 身份驗證 裝置 計算機 可讀 存儲 介質 | ||
本發明涉及人計算機技術領域,提供了一種數字串語音識別方法,包含步驟:獲取待識別語音;將所述語音輸入至數字串語音識別模型進行識別,以得到所述待識別語音對應的數字串文本,其中,構建所述數字串語音識別模型的算法包含卷積神經網絡、長短期記憶網絡及全連接網絡,所述待識別語音進入所述數字串語音識別模型后,先后經由卷積神經網絡、長短期記憶網絡及全連接網絡的計算,得到所述數字串文本。基于本發明實施例所提供的數字串語音識別方法通過對數字串語音識別模型的算法構建進行設計,在識別過程中結合了音頻數據的局部特征及時間維度特征,可提升識別準確率。
技術領域
本發明涉及計算機信息技術領域,尤其涉及一種數字串語音識別方法、身份驗證裝置及計算機可讀存儲介質。
背景技術
語音識別技術,也被稱為自動語音識別Automatic Speech Recognition,(ASR),其目標是將人類的語音中的詞匯內容轉換為計算機可讀的輸入,例如按鍵、二進制編碼或者字符序列。與說話人識別及說話人確認不同,后者嘗試識別或確認發出語音的說話人而非其中所包含的詞匯內容。
隨著數據處理技術的進步以及移動互聯網的快速普及,計算機技術被廣泛地運用到了社會的各個領域,隨之而來的則是海量數據的產生。其中,語音數據受到了人們越來越多的重視。語音識別是一門交叉學科。近二十年來。語音識別技術取得顯著進步,開始從實驗室走向市場。人們預計,未來10年內,語音識別技術將進入工業、家電、通信、汽車電子、醫療、家庭服務、消費電子產品等各個領域。
數字串的語音識別的應用也越來越廣泛,尤其是在身份驗證中,傳統的數字串識別技術是直接通過語音識別在大范圍語料的學習基礎上,進行數字的識別,該方法雖然能夠識別出數字的內容,但是識別準確率低,誤識別率高,有可能將數字識別成其他的字符,在穩定性上無法進行保證。
發明內容
針對上述問題,本發明的實施例提供了一種數字串語音識別方法,所述方法包含步驟:獲取待識別語音;將所述語音輸入至數字串語音識別模型進行識別,以得到所述待識別語音對應的數字串文本,其中,構建所述數字串語音識別模型的算法包含卷積神經網絡、長短期記憶網絡及全連接網絡,所述待識別語音進入所述數字串語音識別模型后,先后經由卷積神經網絡、長短期記憶網絡及全連接網絡的計算,得到所述數字串文本。基于本發明實施例所提供的數字串語音識別方法,可基于預先構建并訓練完成的數字串語音識別模型對待識別語音進行識別,從而得到對應的數字文本內容,同時通過對數字串語音識別模型的算法構建進行設計,在識別過程中結合了音頻數據的局部特征及時間維度特征,可提升識別準確率。
一種身份驗證裝置,包含輸入單元、驗證單元和輸出單元,其中,所述輸出單元向用戶展示語音輸入要求,所述語音輸入要求中包含預設數字串或提示信息;所述輸入單元用于接收用戶輸入的語音信號,并傳輸至驗證單元;所述驗證單元對接收到的語音信號進行驗證,包含基于上述的數字串語音識別方法,對所述語音信號進行識別,并基于識別出的數字串文本對所述用戶身份進行驗證,并發送驗證結果至所述輸出單元;所述輸出單元接收所述驗證結果,并對其進行顯示。
以及,一種計算機可讀存儲介質,存儲有計算機程序,所述計算機程序被處理器執行時實現上述的數字串語音識別方法。
在一實施中,構建所述數字串語音識別模型中的所述卷積神經網絡結構包含一層卷積網絡和一層maxpooling,其中,卷積網絡采用5×5的卷積核,maxpooling層采用5×5的Filter結構。
在一實施中,所述卷積神經網絡的輸入層為所述待識別語音的頻譜圖特征數據,輸出層的數據結構為幀數乘以1024維的矩陣。
在一實施中,所述長短期記憶網絡的結構為3層,每層網絡包含300個神經元。
在一實施中,所述長短期記憶網絡的輸入層為所述卷積神經網絡的輸出結果,輸出層為幀數乘以300維的矩陣。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廈門快商通科技股份有限公司,未經廈門快商通科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010224785.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種大數據的數據存儲系統及方法
- 下一篇:一種核醫學成像系統、裝置及成像方法





