[發明專利]一種遠程會議語音識別數據傳輸方法在審
| 申請號: | 201811323511.1 | 申請日: | 2018-11-08 |
| 公開(公告)號: | CN109525800A | 公開(公告)日: | 2019-03-26 |
| 發明(設計)人: | 何鏑;諸健文;胡紅林;周騁 | 申請(專利權)人: | 江西國泰利民信息科技有限公司 |
| 主分類號: | H04N7/15 | 分類號: | H04N7/15;H04N21/439;H04N21/4402;G10L15/22;G10L15/26;G10L17/04;G10L17/06;G10L21/0208;G10L21/0216 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 330000 江西省南昌市南昌高新技術產*** | 國省代碼: | 江西;36 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音識別 揚聲器 語音識別服務器 語音處理模塊 麥克風陣列 中央處理器 攝像頭 存儲模塊 聲紋訓練 數據傳輸 遠程會議 終端設備 顯示屏 遠程視頻會議 互聯網連接 身份記錄 聲紋識別 構建 文檔 發音 存儲 語音 會議 轉換 身份 | ||
1.一種遠程會議語音識別數據傳輸方法,包括若干個參會終端設備,每個參會終端設備包括麥克風陣列、攝像頭、wifi模塊、語音處理模塊、聲紋訓練模塊、存儲模塊、語音識別服務器、中央處理器、揚聲器和顯示屏,所述語音處理模塊分別連接聲紋訓練模塊和麥克風陣列,所述中央處理器分別連接存儲模塊、攝像頭、麥克風陣列、wifi模塊、揚聲器和顯示屏,所述Wifi模塊通過互聯網連接語音識別服務器,其特征在于,該方法包括構建遠程視頻會議和生成會議記錄文檔,其中,
構建遠程視頻會議包括以下步驟:
步驟1.1)多個參會終端設備同步運行,打開顯示屏,并開啟攝像頭和麥克風陣列分別對現場會議視頻和音頻進行拾取;
步驟1.2)攝像頭捕捉視頻畫面傳送到對應參會終端設備的中央處理器進行編解碼,麥克風陣列搜集語音,一份傳送至對應參會終端設備的中央處理器進行編解碼,另一份傳送至語音處理模塊進行聲紋特征對比以及降噪去回音;
步驟1.3)參會終端設備的中央處理器將編解碼后的視頻畫面和語音通過wifi模塊連接互聯網傳送至其它參會終端設備進行解碼,解碼后的視頻畫面通過顯示器顯示,解碼后的語音通過揚聲器播放,實現遠程視頻會議;
生成會議記錄文檔包括以下步驟:
步驟2.1)語音處理模塊對步驟1.2)中傳輸來的語音流進行聲紋特征對比、降噪、去回聲處理,聲紋訓練模塊從語音處理模塊調用處理過的語音流進行處理并返回給語音處理模塊建立聲紋角色數據庫;
步驟2.2)語音處理模塊將處理后的語音流通過wifi模塊上傳至語音識別服務器進行識別轉碼,并生成會議記錄文檔;
步驟2.3)語音識別服務器將生成的會議記錄文檔回傳至語音處理模塊;
步驟2.4)語音處理模塊通過中央處理器將生成的會議記錄文檔根據保存地址進行存儲。
2.根據權利要求1所述的遠程會議語音識別數據傳輸方法,其特征在于,所述步驟2.1)中,進行聲紋特征對比之前,需對參會人員角色通過聲紋訓練模塊定義需做聲紋訓練處理,對于訓練結果需要對每段人聲進行一次性定義,當語音處理模塊接收到語音流時對聲紋信息進行對比,如果比對成功,則判定發聲人,如果比對失敗,則進行默認定義。
3.根據權利要求1或2所述的遠程會議語音識別數據傳輸方法,其特征在于,所述步驟2.2)中,語音識別服務器對語音處理模塊上傳來的語音流進行角色特征識別對比以及語音內容識別對比,最后生成會議記錄文檔。
4.根據權利要求2所述的遠程會議語音識別數據傳輸方法,其特征在于,在聲紋訓練處理時,每個角色的定義需要一定量的訓練語音流,在視頻會議之前進行語音流訓練,訓練語音流傳通過語音處理模塊建立語音流類別,從而確定發聲角色,類庫中的語音流傳輸至聲紋訓練模塊進行訓練,聲紋訓練模塊對訓練語音流進行特征提取以及通過模型進行訓練,當訓練得出的對比特征閾值R穩定在一定范圍內后對角色進行定義,從而建立聲紋角色數據庫,方便在今后的遠程視頻會議文檔記錄的時候進行調用。
5.根據權利要求4所述的遠程會議語音識別數據傳輸方法,其特征在于,在遠程視頻會議過程中,參會人員的角色語音通過語音處理模塊處理后與聲紋角色數據庫中的角色語音進行特征對比,當對比特征閾值R≤1時,表示角色語音能夠與聲紋角色數據庫中的角色匹配,匹配成功后則定義記錄角色,同時開始識別發聲角色的語音內容,從而生成特定角色的文檔,當對比特征閾值R>1時,則標識無法在聲紋角色數據庫中匹配到準確定義的角色,則系統定義發聲角色為默認角色,然后以默認角色的定義識別語音內容后生成文檔。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于江西國泰利民信息科技有限公司,未經江西國泰利民信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811323511.1/1.html,轉載請聲明來源鉆瓜專利網。





