[發明專利]一種基于視頻通訊的語音轉文字方法在審
| 申請號: | 202010547221.6 | 申請日: | 2020-06-16 |
| 公開(公告)號: | CN111798854A | 公開(公告)日: | 2020-10-20 |
| 發明(設計)人: | 蒲瑤;何國濤;李全忠 | 申請(專利權)人: | 普強信息技術(北京)有限公司 |
| 主分類號: | G10L15/26 | 分類號: | G10L15/26;G10L25/03;G10L25/57;H04N21/44;H04N21/4402;H04N21/4788 |
| 代理公司: | 北京科億知識產權代理事務所(普通合伙) 11350 | 代理人: | 湯東鳳 |
| 地址: | 100000 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 視頻 通訊 語音 轉文 方法 | ||
本發明公開了一種基于視頻通訊的語音轉文字方法,包括以下步驟:S1.將預設語音文本庫和預設特征詞和敏感詞文本庫存入服務器內;S2.采集音頻數據,然后進行語音識別;S3.將語音識別的音頻數據進行糾錯處理,生成目標文字信息;S4.對S3中的目標文字信息進行特征詞識別,然后生成轉化文字信息;S5.將S4中的轉化文字信息發送給服務器,并保存;S6.把服務器收到的文字信息渲染到視頻上,顯示到用戶指定的區域上。本發明通過進行糾錯處理,能夠在語音轉文字的過程中實現對同音字的糾錯,進而提高語音轉文字的準確性,從而提高了用戶的體驗,另外通過特征詞的識別,在需要發送敏感詞時,不必說出敏感詞,也可以發送敏感文字,避免直接說出敏感詞的尷尬。
技術領域
本發明屬于視頻通訊技術領域,具體涉及一種基于視頻通訊的語音轉文字方法。
背景技術
隨著音視頻技術的不斷發展,音頻的質量也在不斷提高。在正常使用視頻通訊進行通話過程中,已經完全可以清晰地聽到對方的聲音。但是在一些特殊的情況下,比如地鐵公交車或者廣場等聲音嘈雜的區域,有時候聽不清對方的聲音會降低音視頻通話的體驗,然而市面上各種的基于視頻通訊的語音轉文字方法仍存在各種各樣的問題。
如授權公告號為CN106297794A所公開的一種語音文字的轉換方法及設備,其雖然實現了解決了多人同時講話的場景下根據用戶分類將語音轉化為對應的文字的問題,但是并未解決現有的基于視頻通訊的語音轉文字方法還存在的問題:不方便在在語音轉文字的過程中對文字信息進行糾偏處理,降低了語音轉文字的準確性,同時在公眾場所需要使用語音轉文字功能時,有時需要發送一些敏感詞給對方,但在公眾場合說出敏感詞,往往會造成用戶的尷尬,為此我們提出一種基于視頻通訊的語音轉文字方法。
發明內容
本發明的目的在于提供一種基于視頻通訊的語音轉文字方法,以解決上述背景技術中提出的問題。
為實現上述目的,本發明提供如下技術方案:一種基于視頻通訊的語音轉文字方法,包括以下步驟:
S1.將預設語音文本庫存入服務器內,預設語音文本庫包括預設方言語音文本庫和預設外語語音文本庫,同時將預設特征詞和敏感詞文本庫存入服務器內;
S2.采集音頻數據,先進行保存,然后進行語音識別;
S3.將語音識別的音頻數據轉化為第一文字信息,并對第一文字信息進行糾錯處理,生成目標文字信息;
S4.對S3中的目標文字信息進行特征詞識別,判斷目標文字信息中是否含有特征詞,然后生成轉化文字信息;
S5.將S4中的轉化文字信息發送給服務器,并保存;
S6.采集視頻數據,并將S2中的音頻數據和視頻數據送入解碼器解碼,之后對音頻數據進行播放以及視頻數據進行渲染,最后把服務器收到的文字信息渲染到視頻上,顯示到用戶指定的區域上。
優選的,所述預設方言語音文本庫包括中國十大方言,所述十大方言包括官話方言、晉方言、吳方言、徽方言、閩方言、粵方言、客家方言、贛方言、湘方言和平話土話。
優選的,所述預設外語語音文本庫包括漢語、英語、俄語、日語、韓語、德語、法語、西班牙語、意大利語、葡萄牙語和泰語,所述漢語設置為普通話。
優選的,所述S3中的糾錯處理具體包括以下步驟:
S31.對所述第一文字信息進行同音字糾錯得到第二文字信息,基于當時的場景信息對所述第二文字信息進行同音字糾錯生成第一初始目標文字信息;
S32.對所述第二文字信息進行同音字糾錯得到第三文字信息,基于當時的場景信息對所述第三文字信息進行同音字糾錯生成第二初始目標文字信息;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于普強信息技術(北京)有限公司,未經普強信息技術(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010547221.6/2.html,轉載請聲明來源鉆瓜專利網。





