[發明專利]多方言混合語音的識別方法、裝置、系統和存儲介質有效
| 申請號: | 201910973395.6 | 申請日: | 2019-10-14 |
| 公開(公告)號: | CN110534115B | 公開(公告)日: | 2021-11-26 |
| 發明(設計)人: | 顧欣欣;陸文淵;曾傳名 | 申請(專利權)人: | 上海企創信息科技有限公司 |
| 主分類號: | G10L15/26 | 分類號: | G10L15/26;G10L15/18;G10L15/00 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 201100 上海市閔*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 多方 混合 語音 識別 方法 裝置 系統 存儲 介質 | ||
本發明實施例公開了一種多方言混合語音的識別方法、裝置、系統和存儲介質。本發明實施例基于已有對應各方言的方言識別子系統,通過對多方言混合語音文件進行分塊處理,得到整個語音文件可能的方言組合,最后將所有方言組合輸入全文辨析子系統進行評分選優的方式,得到多方言混合語音文件的語音識別結果,由此可實現對多方言混合語音文件的有效識別,并保證較高的語音識別準確率。
技術領域
本發明實施例涉及語音識別技術領域,尤其涉及一種多方言混合語音的識別方法、裝置、系統和存儲介質。
背景技術
語音識別是人工智能領域的一個重要應用分支,語音識別的準確率是語音識別效果的重要評估指標。然而在對混合有多種方言(包括漢語普通話、漢語方言,甚至不同國家的語言)的語音文件進行語音識別時,則很難保證較高的語音識別準確率。
現有的語音識別技術多是對單一種類語言的語音進行針對性的語音識別,無法對混合有多種方言的語音文件進行識別或識別效果很差,更無法保證對多方言混合語音具有較高的語音識別準確率。
發明內容
本發明實施例提供一種多方言混合語音的識別方法、裝置、系統和存儲介質,以實現對多方言混合語音的有效識別。
第一方面,本發明實施例提供了一種多方言混合語音的識別方法,該方法包括:
將初始待識別語音作為目標語音,并獲取至少一個方言識別子系統處理所述目標語音得到的語義文本以及與所述語義文本對應的時間線信息,各所述方言識別子系統對應方言的種類至少包括所述初始待識別語音所包含方言的種類;
將各所述語義文本及時間線信息加入到相應方言識別子系統的歷史分詞集中;
獲取各所述方言識別子系統對應的未處理目標語音,依次作為新的目標語音,并返回執行對應所述目標語音的語義文本和時間線信息的獲取操作,直至各所述方言識別子系統均對應不存在未處理目標語音;
針對各所述方言識別子系統對應的歷史分詞集,根據各所述歷史分詞集中的語義文本結合對應的時間線信息形成至少一條分詞序列,并基于各所述分詞序列構成相應方言識別子系統的分詞序列集;
從各所述方言識別子系統所對應的分詞序列集中確定所述初始待識別語音的識別結果。。
第二方面,本發明實施例還提供了一種多方言混合語音的識別裝置,該裝置包括:
語義獲取模塊,用于將初始待識別語音作為目標語音,并獲取至少一個方言識別子系統處理所述目標語音得到的語義文本以及與所述語義文本對應的時間線信息,各所述方言識別子系統對應方言的種類至少包括所述初始待識別語音所包含方言的種類;
語義添加模塊,用于將各所述語義文本及時間線信息加入到相應方言識別子系統的歷史分詞集中;
未處理獲取模塊,用于獲取各所述方言識別子系統對應的未處理目標語音,分別依次作為新的目標語音,并返回執行對應所述目標語音的語義文本和時間線信息的獲取操作,直至各所述方言識別子系統均對應不存在未處理目標語音;
序列形成模塊,用于針對各所述方言識別子系統對應的歷史分詞集,根據各所述歷史分詞集中的語義文本結合對應的時間線信息形成至少一條分詞序列,并基于各所述分詞序列構成相對應方言識別子系統的分詞序列集;
結果確定模塊,用于從各所述方言識別子系統所對應的分詞序列集中確定所述初始待識別語音的識別結果。
第三方面,本發明實施例還提供了一種多方言混合語音的識別系統,該系統包括:
一個或多個處理器;
存儲裝置,用于存儲一個或多個程序;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海企創信息科技有限公司,未經上海企創信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910973395.6/2.html,轉載請聲明來源鉆瓜專利網。





