[發明專利]一種基于語音識別的音頻數據檢索系統在審
| 申請號: | 201711458736.3 | 申請日: | 2017-12-28 |
| 公開(公告)號: | CN108257597A | 公開(公告)日: | 2018-07-06 |
| 發明(設計)人: | 張陽 | 申請(專利權)人: | 合肥凱捷技術有限公司 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;G10L25/54;G06F17/30 |
| 代理公司: | 北京和信華成知識產權代理事務所(普通合伙) 11390 | 代理人: | 胡劍輝 |
| 地址: | 230000 安徽*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 音頻數據文件 匹配索引 特征矢量 音頻數據 語音信息 語音 關鍵字提取模塊 語義分析模塊 語音采集模塊 語音識別模塊 檢索系統 系統數據庫 語音識別 預處理 語音特征矢量 語音信息發送 高低順序 快速檢索 匹配關系 輸入語音 匹配度 檢測 準確率 歸類 采集 轉化 統計 | ||
1.一種基于語音識別的音頻數據檢索系統,其特征在于:包括語音采集模塊、語音識別模塊、關鍵字提取模塊、語義分析模塊、系統數據庫模塊和匹配索引模塊;
所述語音采集模塊用于采集語音信息,對采集的語音信息進行暫存儲,并將存儲后的語音信息發送至匹配索引模塊;
所述語音識別模塊用于接收輸入的語音信息,對接收的語音信息進行語音的首尾檢測,將檢測出的完整句的語音信息發送至關鍵字提取模塊;
所述關鍵字提取模塊接收語音識別模塊檢查的整句語音信息,提取整句語音信息中的關鍵語音,并將提取的關鍵語音發送至語義分析模塊;
所述語義分析模塊接收關鍵字提取模塊發送的關鍵語音,對關鍵語音進行特征矢量轉化,并將轉化的特征矢量進行預處理;
所述系統數據庫模塊用于存儲若干的音頻數據文件,所述系統數據庫模塊內存儲的每個音頻數據文件均包括若干關鍵語音,所述關鍵語音分別轉化成對應的特征矢量;
所述匹配索引模塊分別與語音采集模塊、語義分析模塊和系統數據庫模塊連接,所述匹配索引模塊接收語音采集模塊采集的語音信息,將采集的語音信息依次經語音識別模塊、關鍵字提取模塊和語義分析模塊的處理,并將經語義分析模塊輸出的經預處理后的語音特征矢量反饋至匹配索引模塊;
所述匹配索引模塊將所述關鍵語音對應的語音特征矢量與系統數據庫模塊中關鍵語音對應的特征矢量進行對比,并從系統數據庫模塊中依次順序提取匹配度由高到低的音頻數據文件,且將提取的音頻數據文件發送至劃分整理模塊。
2.根據權利要求1所述的一種基于語音識別的音頻數據檢索系統,其特征在于:還包括劃分整理模塊,所述劃分整理模塊用于接收匹配索引模塊發送的音頻數據文件,對接收的音頻數據文件中的內容進行分析,并按照音頻數據文件中的內容種類進行劃分,經劃分整理后的音頻數據文件重新反饋至系統數據庫模塊。
3.根據權利要求1所述的一種基于語音識別的音頻數據檢索系統,其特征在于:所述語音識別模塊將檢測出的完整句的語音信息按照檢測的時間先后順序依次進行發送。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于合肥凱捷技術有限公司,未經合肥凱捷技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711458736.3/1.html,轉載請聲明來源鉆瓜專利網。





