[發明專利]一種基于語音識別的音頻數據檢索系統在審
| 申請號: | 201711458736.3 | 申請日: | 2017-12-28 |
| 公開(公告)號: | CN108257597A | 公開(公告)日: | 2018-07-06 |
| 發明(設計)人: | 張陽 | 申請(專利權)人: | 合肥凱捷技術有限公司 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;G10L25/54;G06F17/30 |
| 代理公司: | 北京和信華成知識產權代理事務所(普通合伙) 11390 | 代理人: | 胡劍輝 |
| 地址: | 230000 安徽*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 音頻數據文件 匹配索引 特征矢量 音頻數據 語音信息 語音 關鍵字提取模塊 語義分析模塊 語音采集模塊 語音識別模塊 檢索系統 系統數據庫 語音識別 預處理 語音特征矢量 語音信息發送 高低順序 快速檢索 匹配關系 輸入語音 匹配度 檢測 準確率 歸類 采集 轉化 統計 | ||
本發明公開一種基于語音識別的音頻數據檢索系統,包括語音采集模塊、語音識別模塊、關鍵字提取模塊、語義分析模塊、系統數據庫模塊和匹配索引模塊;語音采集模塊將采集的語音信息發送至匹配索引模塊;語音識別模塊檢測語音信息中完整句的語音信息;關鍵字提取模塊提取整句語音信息中關鍵語音;語義分析模塊將提取的關鍵語音進行特征矢量轉化和預處理;匹配索引模塊將關鍵語音對應的語音特征矢量與系統數據庫模塊中特征矢量對比,并按匹配度高低順序提取音頻數據文件。本發明通過輸入語音對應的關鍵語音的特征矢量與音頻數據文件的匹配關系,實現對海量音頻數據的快速檢索,具有檢測速度快和準確率高的特點,便于對音頻數據文件進行統計歸類。
技術領域
本發明屬于音頻數據檢索技術領域,涉及到一種基于語音識別的音頻數據檢索系統。
背景技術
由于因特網的普及,大量的信息迅速累積并廣泛地被使用。因此,時空距離遠近不再是人們存取與使用信息的最大障礙,取而代之的問題是缺乏有效率的方式在浩瀚的因特網中尋找想要的信息。
在現有的語音檢索系統中,利用語音識別結果和相應的格信息進行語音檢索,或者僅僅利用格信息進行語音檢索,有些現有的語音檢索系統結合利用文本檢索方法來提高檢索速度,然而,這樣的系統通常只能處理文本查詢詞。格(lattice)信息的意義在于,在語音檢索領域中,通常情況下語音識別只能得到一個最好的想要的結果,如果運用格信息,就能夠在一定的置信范圍內得到多個可能的語音識別結果,這樣就有更多的選擇,當檢索時,就可以在更多的選擇中檢索,在一定程度上也就緩解了識別錯誤。
語音文件的一些特征可以考慮用于語音檢索,包括音素碼、次文字單元、和語音識別結果。通常,音素碼、次文字單元和語音識別結果在識別過程中都能夠得到格信息。
音素碼是音素語音中最小的單位,是從音色的角度劃分出來的最小的語音單位。在語音學與音韻學中,音素一詞所指的是說話時所發出的聲音。音素是具體存在的物理現象。
目前對海量音頻數據文件進行檢索的過程中,采用人工檢索,工作量極大,且檢索效率低和準確率低;另外,通過輸入的語音信息無法準確的對海量音頻數據文件中符合要求的音頻數據文件進行檢索,若通過語音為基礎的信息檢索音頻數據文件,會導致檢索的準確率較低,同時還需人工進一步進行檢測,增加了人工的工作量,存在檢測速度慢的問題。
發明內容
本發明的目的在于提供一種基于語音識別的音頻數據檢索系統,解決了現有音頻數據文件在檢索時,無法對海量音頻數據進行快速、準確的檢索,存在人工檢索的工作量大、檢測速度慢以及準確度低的問題。
本發明的目的可以通過以下技術方案實現:
一種基于語音識別的音頻數據檢索系統,包括語音采集模塊、語音識別模塊、關鍵字提取模塊、語義分析模塊、系統數據庫模塊和匹配索引模塊;
所述語音采集模塊用于采集語音信息,對采集的語音信息進行暫存儲,并將存儲后的語音信息發送至匹配索引模塊;
所述語音識別模塊用于接收輸入的語音信息,對接收的語音信息進行語音的首尾檢測,將檢測出的完整句的語音信息發送至關鍵字提取模塊;
所述關鍵字提取模塊接收語音識別模塊檢查的整句語音信息,提取整句語音信息中的關鍵語音,并將提取的關鍵語音發送至語義分析模塊;
所述語義分析模塊接收關鍵字提取模塊發送的關鍵語音,對關鍵語音進行特征矢量轉化,并將轉化的特征矢量進行預處理;
所述系統數據庫模塊用于存儲若干的音頻數據文件,所述系統數據庫模塊內存儲的每個音頻數據文件均包括若干關鍵語音,所述關鍵語音分別轉化成對應的特征矢量;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于合肥凱捷技術有限公司,未經合肥凱捷技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711458736.3/2.html,轉載請聲明來源鉆瓜專利網。





