[發明專利]一種廣播電視語音識別系統方法及系統有效
| 申請號: | 201310648375.4 | 申請日: | 2013-12-04 |
| 公開(公告)號: | CN103700370A | 公開(公告)日: | 2014-04-02 |
| 發明(設計)人: | 陳鑫瑋;徐波 | 申請(專利權)人: | 北京中科模識科技有限公司 |
| 主分類號: | G10L15/26 | 分類號: | G10L15/26;G10L15/30;H04N21/439 |
| 代理公司: | 北京路浩知識產權代理有限公司 11002 | 代理人: | 李相雨 |
| 地址: | 100190 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 廣播電視 語音 識別 系統 方法 | ||
1.一種廣播電視語音識別方法,其特征在于,包括:
S1、根據廣播電視數據提取出音頻數據;
S2、對所述音頻數據進行預處理,得到特征文本數據;
S3、將所述特征文本數據發送給云服務器進行識別處理,得到男女聲識別、說話人識別以及語音識別結果;
S4、對所述數據預處理、男女聲識別、說話人識別以及語音識別結果進行融合以及結構化文本標識,生成結構化的語音識別結果。
2.如權利要求1所述的廣播電視語音識別方法,其特征在于,步驟S2對所述音頻數據進行預處理具體包括:
S21、對所述音頻數據進行切分和碎片化處理生成若干個句子文件;
S22、對所述句子文件進行非語音過濾,留下語音句子文件;
S23、對每個語音句子文件進行寬窄帶判別,對判別為寬帶信號的語音句子文件添加寬帶標識,判別為窄帶信號的語音句子文件添加窄帶標識;
S24、對添加寬帶標識和窄帶標識的語音句子文件進行音頻特征提取,得到特征文本數據,其中所述特征文本數據中包含該語音句子的起止時間、語音特征信息、該句子歸屬的音視頻文件名稱和對應的寬窄帶標識。
3.如權利要求1所述的廣播電視語音識別方法,其特征在于,步驟S3將所述特征文本數據發送給云服務器進行識別處理包括:男女聲識別、說話人識別、語音內容識別和標點符號識別,生成含有標識的語音識別結果。
4.如權利要求1所述的廣播電視語音識別方法,其特征在于,步驟S4對所述語音識別結果進行融合以及結構化文本標識具體包括:
S41、對各個語音識別結果進行匯總、對齊,并按照其中包含的起止時間進行排序;
S42、對排序后的語音識別結果按照結構化格式進行標記,包括說話人性別標識、說話人標識、語音內容、標點符號以及時間戳。
5.如權利要求1所述的廣播電視語音識別方法,其特征在于,步驟S3進行識別處理的過程是根據語言模型庫進行識別的,且所述語音模型庫通過網絡文本采集和網絡文本學習不斷進行更新。
6.一種廣播電視語音識別系統,其特征在于,該系統包括:
提取單元,根據廣播電視數據提取出音頻數據;
預處理終端,對所述音頻數據進行預處理,得到特征文本數據,并發送給云服務器;
云服務器,對所述特征文本數據進行識別處理,得到語音識別結果,并對所述語音識別結果進行融合以及結構化文本標識,生成結構化的語音識別結果。
7.如權利要求6所述的廣播電視語音識別系統,其特征在于,所述預處理終端包括:
切分模塊,對所述音頻數據進行切分和碎片化處理生成若干個句子文件;
非語音過濾模塊,對所述句子文件進行非語音過濾,留下語音句子文件;
寬窄帶判別模塊,對每個語音句子文件進行寬窄帶判別,對判別為寬帶信號的語音句子文件添加寬帶標識,判別為窄帶信號的語音句子文件添加窄帶標識;
音頻特征提取模塊,對添加寬帶標識和窄帶標識的語音句子文件進行音頻特征提取,得到特征文本數據,其中所述特征文本數據中包含該語音句子的起止時間、屬于音視頻文件名稱和對應的寬窄帶標識。
8.如權利要求6所述的廣播電視語音識別系統,其特征在于,所述云服務器包括:
男女聲識別模塊,用于對所述特征文本數據進行男女聲識別;
說話人識別模塊,用于對所述特征文本進行說話人識別;
語音內容與標點符號識別模塊,用于對所述特征文本進行語音內容識別以及標點符號識別,生成含有標點符號標識的語音識別結果;
識別結果處理模塊,對所述語音識別結果進行融合以及結構化文本標識,生成結構化的語音識別結果。
9.如權利要求8所述的廣播電視語音識別系統,其特征在于,所述識別結果處理模塊進一步包括:
匯總排序模塊,用于對各個語音識別結果進行匯總、對齊,并按照其中包含的起止時間進行排序;
加標識模塊,用于對排序后的語音識別結果按照結構化格式進行標記,包括說話人性別標識、說話人標識、語音內容、標點符號以及時間戳。
10.如權利要求6所述的廣播電視語音識別系統,其特征在于,所述云服務器中還包括:語言模型智能學習模塊,用于定期搜集網絡文本,通過對網絡文本的學習定期更新語言模型庫,在識別處理過程中根據定期更新的語言模型庫進行識別。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京中科模識科技有限公司,未經北京中科模識科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310648375.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種火電廠鄰機輔汽加熱鍋爐啟動系統
- 下一篇:一種LED組合燈的電源盒結構





