[發明專利]字幕方言詞自動糾正顯示方法以及裝置在審
| 申請號: | 202110759389.8 | 申請日: | 2021-07-05 |
| 公開(公告)號: | CN113435198A | 公開(公告)日: | 2021-09-24 |
| 發明(設計)人: | 陳鏗帆;劉善果 | 申請(專利權)人: | 深圳市鷹碩技術有限公司 |
| 主分類號: | G06F40/289 | 分類號: | G06F40/289;G06F40/216;G06N3/04;G06N3/08 |
| 代理公司: | 深圳余梅專利代理事務所(特殊普通合伙) 44519 | 代理人: | 陳余才 |
| 地址: | 518000 廣東省深圳市寶安區新安*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 字幕 言詞 自動 糾正 顯示 方法 以及 裝置 | ||
本公開是關于一種字幕方言詞自動糾正顯示方法、裝置、電子設備以及存儲介質。其中,該方法包括:對語音數據進行降噪處理,生成待分詞語音數據;根據預設分詞策略,對所述待分詞語音數據進行分詞處理,生成分詞組;以所述分詞組為輸入,基于自然語言文本邏輯分析,生成待確認分詞;統計所述待確認分詞數量,當所述待確認分詞數量大于預設值時,將所述待確認分詞在方言標準特征詞匹配庫中進行匹配,確認所述語言數據對應的方言;基于所述方言的語音?文本識別庫對所述語音數據進行文本轉換,生成字幕并展示。本公開通過基于動態調整分詞數進行方言識別對比的方法,實現了對方言語音的自動快速識別文字轉換并字幕顯示,提升了用戶體驗。
技術領域
本公開涉及互聯網領域,具體而言,涉及一種字幕方言詞自動糾正顯示方法、裝置、電子設備以及計算機可讀存儲介質。
背景技術
字幕(subtitles of motion picture)是指以文字形式顯示電視、電影、舞臺作品中的對話等非影像內容,也泛指影視作品后期加工的文字。在電影銀幕或電視機熒光屏下方出現的解說文字以及種種文字,如影片的片名、演職員表、唱詞、對白、說明詞以有人物介紹、地名和年代等都稱為字幕。影視作品的對話字幕,一般出現在屏幕下方,而戲劇作品的字幕,則可能顯示于舞臺兩旁或上方。
隨著語音識別技術的發展,已經基本可以實現實時語音的字幕文字轉換,但是當待識別的語音為方言且不確定哪種方言時,現有技術并不能實現對方言語音的快速準確的識別。
因此,需要一種或多種方法解決上述問題。
需要說明的是,在上述背景技術部分公開的信息僅用于加強對本公開的背景的理解,因此可以包括不構成對本領域普通技術人員已知的現有技術的信息。
發明內容
本公開的目的在于提供一種字幕方言詞自動糾正顯示方法、裝置、電子設備以及計算機可讀存儲介質,進而至少在一定程度上克服由于相關技術的限制和缺陷而導致的一個或者多個問題。
根據本公開的一個方面,提供一種字幕方言詞自動糾正顯示方法,包括:
在接收到用戶輸入的語音數據后,對所述語音數據進行降噪處理,生成待分詞語音數據;
根據預設分詞策略,對所述待分詞語音數據進行分詞處理,生成分詞組;
以所述分詞組為輸入,基于自然語言文本邏輯分析,生成待確認分詞;
統計所述待確認分詞數量,當所述待確認分詞數量大于預設值時,將所述待確認分詞在方言標準特征詞匹配庫中進行匹配,確認所述語言數據對應的方言;
基于所述方言的語音-文本識別庫對所述語音數據進行文本轉換,生成字幕并展示。
在本公開的一種示例性實施例中,所述方法還包括:
在接收到用戶輸入的語音數據后,對所述語音數據進行基于LMS自適應濾波器的降噪處理,生成待分詞語音數據。
在本公開的一種示例性實施例中,所述方法還包括:
基于正向最大匹配法的預設分詞策略,對所述待分詞語音數據進行分詞處理,生成分詞組。
在本公開的一種示例性實施例中,所述方法還包括:
將所述待分詞語音數據進行分段,將分段后的待分詞語音數據根據預設分詞策略,對所述待分詞語音數據進行分詞處理,生成分詞組。
在本公開的一種示例性實施例中,所述方法還包括:
以所述分詞組為輸入,采用基于Transformer模型的神經網絡模型自然語言文本邏輯分析,生成待確認分詞。
在本公開的一種示例性實施例中,所述方法還包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳市鷹碩技術有限公司,未經深圳市鷹碩技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110759389.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種醫用濾芯結構的濾芯材料及其應用
- 下一篇:一種液壓連續拉伸模





