[發(fā)明專利]字幕方言詞自動糾正顯示方法以及裝置在審

申請?zhí)枺?/td>	202110759389.8	申請日：	2021-07-05
公開（公告）號：	CN113435198A	公開（公告）日：	2021-09-24
發(fā)明（設(shè)計）人：	陳鏗帆;劉善果	申請（專利權(quán)）人：	深圳市鷹碩技術(shù)有限公司
主分類號：	G06F40/289	分類號：	G06F40/289;G06F40/216;G06N3/04;G06N3/08
代理公司：	深圳余梅專利代理事務(wù)所(特殊普通合伙) 44519	代理人：	陳余才
地址：	518000 廣東省深圳市寶安區(qū)新安***	國省代碼：	廣東;44
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	字幕言詞自動糾正顯示方法以及裝置
鉆瓜網(wǎng) 技術(shù)展會專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【權(quán)利要求書】：

1.一種字幕方言詞自動糾正顯示方法，其特征在于，所述方法包括：

在接收到用戶輸入的語音數(shù)據(jù)后，對所述語音數(shù)據(jù)進行降噪處理，生成待分詞語音數(shù)據(jù)；

根據(jù)預(yù)設(shè)分詞策略，對所述待分詞語音數(shù)據(jù)進行分詞處理，生成分詞組；

以所述分詞組為輸入，基于自然語言文本邏輯分析，生成待確認分詞；

統(tǒng)計所述待確認分詞數(shù)量，當所述待確認分詞數(shù)量大于預(yù)設(shè)值時，將所述待確認分詞在方言標準特征詞匹配庫中進行匹配，確認所述語言數(shù)據(jù)對應(yīng)的方言；

基于所述方言的語音-文本識別庫對所述語音數(shù)據(jù)進行文本轉(zhuǎn)換，生成字幕并展示。

2.如權(quán)利要求1所述的方法，其特征在于，所述方法還包括：

在接收到用戶輸入的語音數(shù)據(jù)后，對所述語音數(shù)據(jù)進行基于LMS自適應(yīng)濾波器的降噪處理，生成待分詞語音數(shù)據(jù)。

3.如權(quán)利要求1所述的方法，其特征在于，所述方法還包括：

基于正向最大匹配法的預(yù)設(shè)分詞策略，對所述待分詞語音數(shù)據(jù)進行分詞處理，生成分詞組。

4.如權(quán)利要求1所述的方法，其特征在于，所述方法還包括：

將所述待分詞語音數(shù)據(jù)進行分段，將分段后的待分詞語音數(shù)據(jù)根據(jù)預(yù)設(shè)分詞策略，對所述待分詞語音數(shù)據(jù)進行分詞處理，生成分詞組。

5.如權(quán)利要求1所述的方法，其特征在于，所述方法還包括：

以所述分詞組為輸入，采用基于Transformer模型的神經(jīng)網(wǎng)絡(luò)模型自然語言文本邏輯分析，生成待確認分詞。

6.如權(quán)利要求1所述的方法，其特征在于，所述方法還包括：

以所述分詞組為輸入，基于自然語言文本邏輯分析，生成待確認分詞，若同一待確認分詞出現(xiàn)多次，則重復(fù)統(tǒng)計所述待確認分詞總次數(shù)，并分別統(tǒng)計所述待確認分詞的出現(xiàn)次數(shù)。

7.如權(quán)利要求1所述的方法，其特征在于，所述方法還包括：

統(tǒng)計所述待確認分詞數(shù)量，當所述待確認分詞數(shù)量大于預(yù)設(shè)值時，將所述待確認分詞在方言標準特征詞匹配庫中進行匹配，并按照匹配度進行正序排序，選取排序第一的方言確認為所述語言數(shù)據(jù)對應(yīng)的方言。

8.如權(quán)利要求7所述的方法，其特征在于，所述方法還包括：

統(tǒng)計所述待確認分詞數(shù)量，當所述待確認分詞數(shù)量大于預(yù)設(shè)值時，將所述待確認分詞在方言標準特征詞匹配庫中進行匹配，并按照匹配度進行正序排序，若所述正序排序中排序第一與排序第二的匹配度差距小于10％，則增加預(yù)設(shè)數(shù)量的所述待確認分詞，將增加預(yù)設(shè)數(shù)量的所述待確認分詞在方言標準特征詞匹配庫中再次進行匹配，并按照匹配度確認所述語言數(shù)據(jù)對應(yīng)的方言。

9.如權(quán)利要求1所述的方法，其特征在于，所述方法還包括：

基于所述方言的語音-文本識別庫對所述語音數(shù)據(jù)進行文本轉(zhuǎn)換，生成字幕并展示時，同時標注顯示方言信息。

10.如權(quán)利要求1所述的方法，其特征在于，所述方法還包括：

在接收到新的用戶輸入的語音數(shù)據(jù)后，重新進行方言匹配處理，并優(yōu)先選取歷史方言進行匹配。

11.一種字幕方言詞自動糾正顯示裝置，其特征在于，所述裝置包括：

待分詞語音數(shù)據(jù)生成模塊，用于在接收到用戶輸入的語音數(shù)據(jù)后，對所述語音數(shù)據(jù)進行降噪處理，生成待分詞語音數(shù)據(jù)；

分詞組生成模塊，用于根據(jù)預(yù)設(shè)分詞策略，對所述待分詞語音數(shù)據(jù)進行分詞處理，生成分詞組；

待確認分詞生成模塊，用于以所述分詞組為輸入，基于自然語言文本邏輯分析，生成待確認分詞；

方言確認模塊，用于統(tǒng)計所述待確認分詞數(shù)量，當所述待確認分詞數(shù)量大于預(yù)設(shè)值時，將所述待確認分詞在方言標準特征詞匹配庫中進行匹配，確認所述語言數(shù)據(jù)對應(yīng)的方言；

字幕展示模塊，用于基于所述方言的語音-文本識別庫對所述語音數(shù)據(jù)進行文本轉(zhuǎn)換，生成字幕并展示。

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳市鷹碩技術(shù)有限公司，未經(jīng)深圳市鷹碩技術(shù)有限公司許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202110759389.8/1.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

上一篇：一種醫(yī)用濾芯結(jié)構(gòu)的濾芯材料及其應(yīng)用
下一篇：一種液壓連續(xù)拉伸模

同類專利

專利分類

G 物理

G06 計算；推算；計數(shù)
G06F 電數(shù)字數(shù)據(jù)處理

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實用新型專利、外觀設(shè)計專利（升級中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】