[發明專利]多方言混合語音的識別方法、裝置、系統和存儲介質有效

申請號：	201910973395.6	申請日：	2019-10-14
公開（公告）號：	CN110534115B	公開（公告）日：	2021-11-26
發明（設計）人：	顧欣欣;陸文淵;曾傳名	申請（專利權）人：	上海企創信息科技有限公司
主分類號：	G10L15/26	分類號：	G10L15/26;G10L15/18;G10L15/00
代理公司：	北京品源專利代理有限公司 11332	代理人：	孟金喆
地址：	201100 上海市閔***	國省代碼：	上海;31
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	多方混合語音識別方法裝置系統存儲介質
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

本發明實施例公開了一種多方言混合語音的識別方法、裝置、系統和存儲介質。本發明實施例基于已有對應各方言的方言識別子系統，通過對多方言混合語音文件進行分塊處理，得到整個語音文件可能的方言組合，最后將所有方言組合輸入全文辨析子系統進行評分選優的方式，得到多方言混合語音文件的語音識別結果，由此可實現對多方言混合語音文件的有效識別，并保證較高的語音識別準確率。

技術領域

本發明實施例涉及語音識別技術領域，尤其涉及一種多方言混合語音的識別方法、裝置、系統和存儲介質。

背景技術

語音識別是人工智能領域的一個重要應用分支，語音識別的準確率是語音識別效果的重要評估指標。然而在對混合有多種方言(包括漢語普通話、漢語方言，甚至不同國家的語言)的語音文件進行語音識別時，則很難保證較高的語音識別準確率。

現有的語音識別技術多是對單一種類語言的語音進行針對性的語音識別，無法對混合有多種方言的語音文件進行識別或識別效果很差，更無法保證對多方言混合語音具有較高的語音識別準確率。

發明內容

本發明實施例提供一種多方言混合語音的識別方法、裝置、系統和存儲介質，以實現對多方言混合語音的有效識別。

第一方面，本發明實施例提供了一種多方言混合語音的識別方法，該方法包括：

將初始待識別語音作為目標語音，并獲取至少一個方言識別子系統處理所述目標語音得到的語義文本以及與所述語義文本對應的時間線信息，各所述方言識別子系統對應方言的種類至少包括所述初始待識別語音所包含方言的種類；

將各所述語義文本及時間線信息加入到相應方言識別子系統的歷史分詞集中；

獲取各所述方言識別子系統對應的未處理目標語音，依次作為新的目標語音，并返回執行對應所述目標語音的語義文本和時間線信息的獲取操作，直至各所述方言識別子系統均對應不存在未處理目標語音；

針對各所述方言識別子系統對應的歷史分詞集，根據各所述歷史分詞集中的語義文本結合對應的時間線信息形成至少一條分詞序列，并基于各所述分詞序列構成相應方言識別子系統的分詞序列集；

從各所述方言識別子系統所對應的分詞序列集中確定所述初始待識別語音的識別結果。。

第二方面，本發明實施例還提供了一種多方言混合語音的識別裝置，該裝置包括：

語義獲取模塊，用于將初始待識別語音作為目標語音，并獲取至少一個方言識別子系統處理所述目標語音得到的語義文本以及與所述語義文本對應的時間線信息，各所述方言識別子系統對應方言的種類至少包括所述初始待識別語音所包含方言的種類；

語義添加模塊，用于將各所述語義文本及時間線信息加入到相應方言識別子系統的歷史分詞集中；

未處理獲取模塊，用于獲取各所述方言識別子系統對應的未處理目標語音，分別依次作為新的目標語音，并返回執行對應所述目標語音的語義文本和時間線信息的獲取操作，直至各所述方言識別子系統均對應不存在未處理目標語音；

序列形成模塊，用于針對各所述方言識別子系統對應的歷史分詞集，根據各所述歷史分詞集中的語義文本結合對應的時間線信息形成至少一條分詞序列，并基于各所述分詞序列構成相對應方言識別子系統的分詞序列集；

結果確定模塊，用于從各所述方言識別子系統所對應的分詞序列集中確定所述初始待識別語音的識別結果。

第三方面，本發明實施例還提供了一種多方言混合語音的識別系統，該系統包括：

一個或多個處理器；

存儲裝置，用于存儲一個或多個程序；

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于上海企創信息科技有限公司，未經上海企創信息科技有限公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201910973395.6/2.html，轉載請聲明來源鉆瓜專利網。

上一篇：一種在網頁上翻譯語音文件時先識別再翻譯的方法
下一篇：應用于智能設備的語音識別模型設置方法及裝置

同類專利

專利分類

G 物理

G10 樂器；聲學
G10L 語音分析或合成；語音識別；音頻分析或處理
G10L15-00 語音識別
G10L15-02 .語音識別的特征提取；識別單位的選擇
G10L15-04 .分段或字極限檢測
G10L15-06 .創建基準模板；訓練語音識別系統，例如對說話者聲音特征的適應
G10L15-08 .語音分類或檢索
G10L15-20 .專門適用于不利環境

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產權局專利說明書；

2、支持發明專利、實用新型專利、外觀設計專利（升級中）；

3、專利數據每周兩次同步更新，支持Adobe PDF格式；

4、內容包括專利技術的結構示意圖、流程工藝圖或技術構造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】