[發明專利]控制語音的識別方法及目標角色的控制方法、相關裝置在審
| 申請號: | 202111034200.5 | 申請日: | 2021-09-03 |
| 公開(公告)號: | CN113903333A | 公開(公告)日: | 2022-01-07 |
| 發明(設計)人: | 張正明;李誠 | 申請(專利權)人: | 上海商湯智能科技有限公司 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;G10L15/02;G10L15/04;G10L15/10;G10L25/24 |
| 代理公司: | 深圳市威世博知識產權代理事務所(普通合伙) 44280 | 代理人: | 黎堅怡 |
| 地址: | 200233 上海市徐*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 控制 語音 識別 方法 目標 角色 相關 裝置 | ||
本申請公開了一種控制語音的識別方法及目標角色的控制方法、相關裝置,其中,控制語音的識別方法包括:獲取語音數據流中的目標語音分段;獲取所述目標語音分段對應的語音特征;獲得所述目標語音分段對應的語音特征與參考語音特征之間的相似度;響應于所述相似度大于預設閾值,確定所述目標語音分段為與所述參考語音特征對應的目標控制指令相關的控制語音。上述方案,能夠快速識別出控制語音。
技術領域
本申請涉及語音識別技術領域,特別是涉及一種控制語音的識別方法及目標角色的控制方法、相關裝置。
背景技術
近年來,人工智能(Artificial Intelligence,AI)教育逐漸變得火熱,大多數AI教育課程都以在線課程平臺為基礎進行延伸,輔以相應的硬件設備,如智能小車、智能機器人等。AI教育涉及到許多算法,從語音到圖像,從傳統算法到深度學習。在課堂中為了能夠引起學生的興趣,通常會將一些人工智能技術與游戲相結合,讓學生能夠更直觀的看到AI技術的應用。語音識別技術與游戲的結合能夠帶來更多的互動效果,為課堂帶來更多的知識與快樂。
目前的語音識別接口通常是以一段.wav或者.mp3格式的語音文件作為輸入,語音識別接口通過一些復雜的算法識別出語音文件的內容。但是對于語音游戲來說,所用到的語音接口需要能夠處理語音數據流、識別速度快、實時反饋結果,這是當前許多語音識別接口所做不到的。
發明內容
本申請提供一種控制語音的識別方法及目標角色的控制方法、相關裝置。
本申請第一方面提供了一種控制語音的識別方法,所述方法包括:獲取語音數據流中的目標語音分段;獲取所述目標語音分段對應的語音特征;獲得所述目標語音分段對應的語音特征與參考語音特征之間的相似度;響應于所述相似度大于預設閾值,確定所述目標語音分段為與所述參考語音特征對應的目標控制指令相關的控制語音。
因此,在獲取語音數據流中的目標語音分段后,可以獲取目標語音分段對應的語音特征,于是可以計算目標語音分段對應的語音特征與參考語音特征之間的相似度,然后根據相似度是否大于預設閾值,來確定目標語音分段是否為與參考語音特征對應的目標控制指令相關的控制語音,從而可以根據實時獲取的語音數據流,快速識別出其中的控制語音,并識別出控制語音對應的目標控制指令,無需語音輸入輸出(Input Output,IO)操作,能夠做到實時識別,使音控游戲可以進行實時響應。
其中,所述獲取語音數據流中的目標語音分段,包括:利用語音采集設備采集所述語音數據流;將所述語音數據流中的背景音進行過濾,得到所述語音數據流中的目標語音分段。
因此,利用語音采集設備實時采集語音數據流,可以將語音數據流中的背景音進行過濾,從而得到語音數據流中的目標語音分段,可提高語音識別準確度,便于快速判斷語音數據流中的目標語音分段是否為控制語音,無需語音IO操作,能夠做到實時識別,為使音控游戲進行實時響應提供技術支持。
其中,所述將所述語音數據流中的背景音進行過濾,得到所述語音數據流中的目標語音分段,包括:以設定長度的時間窗口對所述語音數據流進行劃分,得到多個語音分段;對所述多個語音分段中的至少部分語音分段進行語音活動檢測,得到所述至少部分語音分段對應的振幅峰值;將所述振幅峰值大于預設幅值的語音分段作為所述目標語音分段。
因此,可以根據實際應用場景來設置時間窗口的長度,然后對語音數據流按照時間窗口進行劃分,可以得到多個語音分段,于是可以對其中的至少部分語音分段進行語音活動檢測,并認為對應的振幅峰值大于預設幅值的語音分段是用戶輸入的目標語音分段,從而可以實現判斷用戶輸入的目標語音分段是否為控制語音,提高用戶語音識別準確度。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海商湯智能科技有限公司,未經上海商湯智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111034200.5/2.html,轉載請聲明來源鉆瓜專利網。





