[發明專利]一種會議現場同步速記的系統和方法有效
| 申請號: | 201710538599.8 | 申請日: | 2017-07-04 |
| 公開(公告)號: | CN107342080B | 公開(公告)日: | 2020-07-24 |
| 發明(設計)人: | 盧捷;柯登峰 | 申請(專利權)人: | 廈門創客貓網絡科技有限公司 |
| 主分類號: | G10L15/18 | 分類號: | G10L15/18;G10L15/19;G10L15/16;G10L15/06;G10L15/08;G10L15/26;G10L15/30;G10L25/24;G10L25/30;G11B27/10 |
| 代理公司: | 北京天江律師事務所 11537 | 代理人: | 朱紅來 |
| 地址: | 361000 福建省*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 會議 現場 同步 速記 系統 方法 | ||
1.一種會議現場同步速記的系統,其特征在于:所述系統由終端、服務器和客戶端組成;所述終端包括中文速錄機(S5)、語音采集模塊(S1);中文速錄機(S5)通過速錄機通訊模塊(S6)和服務器的文字接收模塊(S7)相連接;語音采集模塊(S1)通過時間延遲模塊(S2)和服務器的語音識別解碼模塊(S3)相連接;服務器包括自動分詞模塊(S8),自動分詞模塊(S8)分別和文法生成模塊(S14)、潛在語義分析模塊(S11)、字型到音素模塊(S9)相連接;
所述文法生成模塊(S14)和大文法模型(S13)相連接,大文法模型(S13)連接在語音識別解碼模塊(S3)上;潛在語義分析模塊(S11)通過文法語義映射表(S12)連接到大文法模型(S13)上,字型到音素模塊(S9)通過發音詞典(S10)和語音識別解碼模塊(S3)相連接。
2.根據權利要求1所述的會議現場同步速記的系統,其特征在于:所述語音識別解碼模塊(S3)連接客戶端的語音文字排版輸出模塊(S4),語音識別解碼模塊(S3)上設置有聲學模型(S16)和小文法模型(S15)。
3.一種會議現場同步速記的方法,其特征在于:所述方法的具體步驟如下:
會場的語音經過語音采集模塊(S1)采集后,形成16K16比特單通道PCM格式錄音,在時間延遲模塊(S2)中緩存至少30秒鐘,后經過時間延遲模塊(S2)檢測并分成若干句話,送到語音識別解碼模塊(S3)進行語音識別,語音識別解碼模塊(S3)采用基于動態有限狀態機網絡的集束搜索算法,需要聲學模型(S16)、發音詞典(S10)、大文法模型(S13),小文法模型(S15)作為輸入,最終的識別結果含有每個詞的時間信息和置信度信息,由語音文字排版輸出模塊(S4)用不同顏色顯示出來,速記員速錄的文字信息總是比語音信息提前30秒以上到達服務器的語音識別解碼模塊(S3)并被語音識別解碼模塊(S3)所利用;
速記員使用終端的中文速錄機(S5),在中文速錄機(S5)中進行文字錄入,速錄機通訊模塊(S6)實時監控中文速錄機(S5)并通過USB端口取出速記員錄入的文字信息送到服務器,由服務器中的文字接收模塊(S7)接收,隨后送給自動分詞模塊(S8)進行分詞,分詞結果如果出現詞典中沒有的詞,送到字型到音素模塊(S9)自動注音,將單詞和注音結果添加到發音詞典(S10)中,所有的分詞結果在潛在語義分析模塊(S11)中進行語義分析,分析出排名前十名的潛在語義,并從文法語義映射表(S12)中查出對應潛在語義的文法,在大文法模型(S13)修改對應潛在語義的文法的對數概率,排名第一名的文法的對數概率值增加2.0,排名第二名的文法的對數概率值增加1.9,排名第三名的文法的對數概率值增加1.8,以此類推;
在文法生成模塊(S14)中將自動分詞結果中出現的二元文法、三元文法、四元文法、五元文法全部賦予對數概率-0.1,賦予回退對數概率0,插入到大文法模型中,發音詞典(S10)和大文法模型(S13)隨著速記員的錄入文字改變而改變,從而影響語音識別解碼模塊(S3)的識別結果;
最終由語音識別解碼模塊(S3)輸出最終的語音識別信息到語音文字排版輸出模塊(S4)中進行排版。
4.根據權利要求3所述的會議現場同步速記的方法,其特征在于:所述聲學模型(S16)采用三音子狀態作為輸出,采用梅爾頻率倒譜系數或者梅爾頻率子帶對數能量譜作為輸入的深度神經網絡,該網絡可以為前饋型網絡、循環網絡或雙向循環網絡。
5.根據權利要求3所述的會議現場同步速記的方法,其特征在于:所述發音詞典(S10)采用多元文法模型并表示成兩個加權有限狀態機網絡的動態組合。
6.根據權利要求3所述的會議現場同步速記的方法,其特征在于:所述發音詞典(S10)采用聲母和帶調的韻母為漢語的詞匯注音,采用國際音標為外來語言注音;所述語音的解碼算法采用基于動態構建有限狀態機網絡的集束搜索算法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廈門創客貓網絡科技有限公司,未經廈門創客貓網絡科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710538599.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種基于互聯網的真實人聲的采集系統
- 下一篇:用于提供語音服務的方法和裝置





