[發明專利]一種自動切換語種方法、裝置、系統、設備和存儲介質在審

申請號：	202010766838.7	申請日：	2020-08-03
公開（公告）號：	CN111798836A	公開（公告）日：	2020-10-20
發明（設計）人：	范紅亮;李旭濱	申請（專利權）人：	上海茂聲智能科技有限公司
主分類號：	G10L15/00	分類號：	G10L15/00;G10L15/22
代理公司：	上海領譽知識產權代理有限公司 31383	代理人：	車超平;王琰
地址：	201306 上海***	國省代碼：	上海;31
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	一種自動切換語種方法裝置系統設備存儲介質
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

本申請涉及一種自動切換語種方法、裝置、系統、設備及存儲介質，該方法包括獲取喚醒語音數據；對喚醒語音數據進行處理，以獲得喚醒詞、喚醒語音片段；識別喚醒詞和/或喚醒語音片段，以獲得識別語種類型；在識別語種類型與當前語種類型不同的情況下，切換當前語種類型識別語種類型，解決了無法進行多語種切換識別的問題，實現了自動切換語種識別模型的技術效果。

技術領域

本申請涉及語音識別技術領域，特別是涉及一種自動切換語種方法、裝置、系統、設備和存儲介質。

背景技術

針對一些多語種的語音識別場景，需要根據說話者的語種情況，選擇合適語音識別引擎，從而達到最佳的語音識別效果。

在相關技術中，通常有兩種方式來滿足多語種的識別需求。第一種方式是訓練多語種混合識別模型；第二種方式是每個語種都針對性地訓練該語種的語音識別模型，每個語種均具有其獨立的語音識別引擎進行識別。

然而上述方式均具有缺陷。對于第一種方式而言，雖然直接訓練多語種混合識別模型簡單方便，但是其識別準確率低、識別效果差，無法對每個語種都有較高的識別準確率、較好的識別效果，而且，不同語種之間的識別會相互干擾。對于第二種方式而言，雖然每個語種的語音識別模型對該語種的識別準確率高、識別效果好，但是無法針對說話人選擇合適的語音識別模型進行識別。

為了解決第二種方式的缺陷，在相關技術中，通常會配置一個語種選擇選項(語種選擇菜單)，在識別之前先選擇對應的語音識別模型，然后再進行識別。但是這種方法仍然存在缺陷，如只能適用于單一語種環境，無法在多語種環境下進行識別；需要人工選擇，操作繁瑣。

目前針對相關技術中無法進行多語種切換識別的問題，尚未提出有效的解決方案。

發明內容

本申請實施例提供了一種自動切換語種方法、裝置、系統、設備和存儲介質，以至少解決相關技術中無法進行多語種切換識別的問題。

第一方面，本申請實施例提供了一種自動切換語種方法，包括：

獲取喚醒語音數據；

對所述喚醒語音數據進行處理，以獲得喚醒詞、喚醒語音片段；

識別所述喚醒詞和/或所述喚醒語音片段，以獲得識別語種類型；

在所述識別語種類型與當前語種類型不同的情況下，切換所述當前語種類型為所述識別語種類型。

在其中的一些實施例中，在切換所述當前語種類型為所述識別語種類型之后，所述方法還包括：

選擇與所述識別語種類型相對應的語音識別引擎；

使用所述語音識別引擎對所述喚醒語音數據進行識別，以生成喚醒語音識別結果。