[發明專利]一種會議現場同步速記的系統和方法有效
| 申請號: | 201710538599.8 | 申請日: | 2017-07-04 |
| 公開(公告)號: | CN107342080B | 公開(公告)日: | 2020-07-24 |
| 發明(設計)人: | 盧捷;柯登峰 | 申請(專利權)人: | 廈門創客貓網絡科技有限公司 |
| 主分類號: | G10L15/18 | 分類號: | G10L15/18;G10L15/19;G10L15/16;G10L15/06;G10L15/08;G10L15/26;G10L15/30;G10L25/24;G10L25/30;G11B27/10 |
| 代理公司: | 北京天江律師事務所 11537 | 代理人: | 朱紅來 |
| 地址: | 361000 福建省*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 會議 現場 同步 速記 系統 方法 | ||
本發明公開了一種會議現場同步速記的系統和方法;系統由終端、服務器和客戶端組成;終端包括中文速錄機、語音采集模塊;中文速錄機通過速錄機通訊模塊和服務器的文字接收模塊相連接;語音采集模塊通過時間延遲模塊和服務器的語音識別解碼模塊相連接;服務器包括自動分詞模塊,自動分詞模塊分別和文法生成模塊、潛在語義分析模塊、字型到音素模塊相連接。方法包括多個步驟。本發明了通用模型對特定領域識別率不高的問題,在速記員人工輸入信息的幫助下,語音識別系統錯誤率相對降低了80%;解決了大型會議需要速記員數量多的問題,并且大大提高了速記員的工作效率,節省了大量人力,更加經濟、方便、使用。
技術領域
本發明涉及一種同步速記的系統和方法,尤其涉及一種會議現場同步速記的系統和方法。
背景技術
由于一些重要會議、重要發言需要進行現場速記,使人們一直在培養專業的速記人員以及開發相關的速記系統或設備。速記員由于工作量的限制,在速記過程中往往會漏聽或錯記一些關鍵話語,導致速記內容的不完整或者存在記錄錯誤等問題,有時有些大型會議需要大量的速記人員,很難找到合適且數量眾多的速記人員。此外,目前還沒有一款能配合速記人員提供速記速度且錯誤率較低的速記系統或方法。
因此需要一款能并且提高速記員的工作效率、錯誤率較低且能節省了大量人力,方便、使用的會議現場同步速記的系統和方法。
發明內容
為了解決上述技術所存在的不足之處,本發明提供了一種會議現場同步速記的系統和方法。
為了解決以上技術問題,本發明采用的技術方案是:一種會議現場同步速記的系統,系統由終端、服務器和客戶端組成;終端包括中文速錄機、語音采集模塊;中文速錄機通過速錄機通訊模塊和服務器的文字接收模塊相連接;語音采集模塊通過時間延遲模塊和服務器的語音識別解碼模塊相連接;服務器包括自動分詞模塊,自動分詞模塊分別和文法生成模塊、潛在語義分析模塊、字型到音素模塊相連接;
文法生成模塊和大文法模型相連接,大文法模型連接在語音識別解碼模塊上;潛在語義分析模塊通過文法語義映射表連接到大文法模型上,字型到音素模塊通過發音詞典和語音識別解碼模塊相連接。
語音識別解碼模塊連接客戶端的語音文字排版輸出模塊,語音識別解碼模塊上設置有聲學模型和小文法模型。
方法的具體步驟如下:
會場的語音經過語音采集模塊采集后,形成16K16比特單通道PCM格式錄音,在時間延遲模塊中緩存至少30秒鐘,后經過時間延遲模塊檢測并分成若干句話,送到語音識別解碼模塊進行語音識別,語音識別解碼模塊采用基于動態有限狀態機網絡的集束搜索算法,需要聲學模型、發音詞典、大文法模型,小文法模型作為輸入,最終的識別結果含有每個詞的時間信息和置信度信息,由語音文字排版輸出模塊用不同顏色顯示出來,速記員速錄的文字信息總是比語音信息提前30秒以上到達服務器的語音識別解碼模塊并被語音識別解碼模塊所利用;
速記員使用終端的中文速錄機,在中文速錄機中進行文字錄入,速錄機通訊模塊實時監控中文速錄機并通過USB端口取出速記員錄入的文字信息送到服務器,由服務器中的文字接收模塊接收,隨后送給自動分詞模塊進行分詞,分詞結果如果出現詞典中沒有的詞,送到字型到音素模塊自動注音,將單詞和注音結果添加到發音詞典中,所有的分詞結果在潛在語義分析模塊中進行語義分析,分析出排名前十名的潛在語義,并從文法語義映射表中查出對應潛在語義的文法,在大文法模型修改對應潛在語義的文法的對數概率,排名第一名的文法的對數概率值增加2.0,排名第二名的文法的對數概率值增加1.9,排名第三名的文法的對數概率值增加1.8,以此類推;
在文法生成模塊中將自動分詞結果中出現的二元文法、三元文法、四元文法、五元文法全部賦予對數概率-0.1,賦予回退對數概率0,插入到大文法模型中,發音詞典和大文法模型隨著速記員的錄入文字改變而改變,從而影響語音識別解碼模塊的識別結果;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廈門創客貓網絡科技有限公司,未經廈門創客貓網絡科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710538599.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種基于互聯網的真實人聲的采集系統
- 下一篇:用于提供語音服務的方法和裝置





