[發明專利]一種自動切換語種方法、裝置、系統、設備和存儲介質在審
| 申請號: | 202010766838.7 | 申請日: | 2020-08-03 |
| 公開(公告)號: | CN111798836A | 公開(公告)日: | 2020-10-20 |
| 發明(設計)人: | 范紅亮;李旭濱 | 申請(專利權)人: | 上海茂聲智能科技有限公司 |
| 主分類號: | G10L15/00 | 分類號: | G10L15/00;G10L15/22 |
| 代理公司: | 上海領譽知識產權代理有限公司 31383 | 代理人: | 車超平;王琰 |
| 地址: | 201306 上海*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 自動 切換 語種 方法 裝置 系統 設備 存儲 介質 | ||
本申請涉及一種自動切換語種方法、裝置、系統、設備及存儲介質,該方法包括獲取喚醒語音數據;對喚醒語音數據進行處理,以獲得喚醒詞、喚醒語音片段;識別喚醒詞和/或喚醒語音片段,以獲得識別語種類型;在識別語種類型與當前語種類型不同的情況下,切換當前語種類型識別語種類型,解決了無法進行多語種切換識別的問題,實現了自動切換語種識別模型的技術效果。
技術領域
本申請涉及語音識別技術領域,特別是涉及一種自動切換語種方法、裝置、系統、設備和存儲介質。
背景技術
針對一些多語種的語音識別場景,需要根據說話者的語種情況,選擇合適語音識別引擎,從而達到最佳的語音識別效果。
在相關技術中,通常有兩種方式來滿足多語種的識別需求。第一種方式是訓練多語種混合識別模型;第二種方式是每個語種都針對性地訓練該語種的語音識別模型,每個語種均具有其獨立的語音識別引擎進行識別。
然而上述方式均具有缺陷。對于第一種方式而言,雖然直接訓練多語種混合識別模型簡單方便,但是其識別準確率低、識別效果差,無法對每個語種都有較高的識別準確率、較好的識別效果,而且,不同語種之間的識別會相互干擾。對于第二種方式而言,雖然每個語種的語音識別模型對該語種的識別準確率高、識別效果好,但是無法針對說話人選擇合適的語音識別模型進行識別。
為了解決第二種方式的缺陷,在相關技術中,通常會配置一個語種選擇選項(語種選擇菜單),在識別之前先選擇對應的語音識別模型,然后再進行識別。但是這種方法仍然存在缺陷,如只能適用于單一語種環境,無法在多語種環境下進行識別;需要人工選擇,操作繁瑣。
目前針對相關技術中無法進行多語種切換識別的問題,尚未提出有效的解決方案。
發明內容
本申請實施例提供了一種自動切換語種方法、裝置、系統、設備和存儲介質,以至少解決相關技術中無法進行多語種切換識別的問題。
第一方面,本申請實施例提供了一種自動切換語種方法,包括:
獲取喚醒語音數據;
對所述喚醒語音數據進行處理,以獲得喚醒詞、喚醒語音片段;
識別所述喚醒詞和/或所述喚醒語音片段,以獲得識別語種類型;
在所述識別語種類型與當前語種類型不同的情況下,切換所述當前語種類型為所述識別語種類型。
在其中的一些實施例中,在切換所述當前語種類型為所述識別語種類型之后,所述方法還包括:
選擇與所述識別語種類型相對應的語音識別引擎;
使用所述語音識別引擎對所述喚醒語音數據進行識別,以生成喚醒語音識別結果。
在其中的一些實施例中,識別所述喚醒詞和/或所述喚醒語音片段,以獲得識別語種類型包括:
識別若干所述喚醒詞,以獲得若干第一識別語種類型;
統計若干所述第一識別語種類型的次數;
在一所述第一識別語種類型的次數最多的情況下,將該所述第一識別語種類型作為識別語種類型。
在其中的一些實施例中,識別所述喚醒詞和/或所述喚醒語音片段,以獲得識別語種類型包括:
識別若干所述喚醒語音片段,以獲得若干第二識別語種類型;
統計若干所述第二識別語種類型的次數;
在一所述第二識別語種類型的次數最多的情況下,將該所述第二識別語種類型作為識別語種類型。
在其中的一些實施例中,識別所述喚醒詞和/或所述喚醒語音片段,以獲得識別語種類型包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海茂聲智能科技有限公司,未經上海茂聲智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010766838.7/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種單煤氣分級燃燒器
- 下一篇:一種多體制調制器





