[發明專利]語音識別能力測試方法和裝置有效
| 申請號: | 201710488838.3 | 申請日: | 2017-06-23 |
| 公開(公告)號: | CN107086040B | 公開(公告)日: | 2021-03-02 |
| 發明(設計)人: | 柳燕飛;王秀芬 | 申請(專利權)人: | 歌爾股份有限公司 |
| 主分類號: | G10L25/51 | 分類號: | G10L25/51;G10L15/26 |
| 代理公司: | 北京太合九思知識產權代理有限公司 11610 | 代理人: | 劉戈 |
| 地址: | 261031 山東省濰坊*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 識別 能力 測試 方法 裝置 | ||
本發明實施例提供了一種語音識別能力測試方法和裝置,包括:接收測試命令,所述測試命令中包括測試詞語和測試模式;獲取與所述測試詞語和所述測試模式對應的測試音頻文件;對所述測試音頻文件進行語音識別;將所述識別結果與所述測試詞語進行相似度比較,以輸出測試結果。通過實施本方案對應的實施例,可以提高語音識別能力測試的測試結果的準確率。
技術領域
本發明涉及語音識別技術領域,尤其涉及一種語音識別能力測試方法和裝置。
背景技術
語音識別技術使機器聽懂人類說話,在機器智能化過程中起著重要作用。因此,需要對語音識別系統的語音識別能力進行測評,以保證機器準確識別語音命令。
現有語音識別能力測評方式為人工發音,具體為如下過程:測試人員人工說出語音命令,并由測試人員觀察機器的識別結果,進而判斷機器能否準確識別語音命令,此處的識別結果為:機器對語音進行分析后所輸出的語音內容對應的文字。
人工發音雖然可以測評機器識別語音命令的能力,但是,人工發音的測試過程具有局限性。例如,人工發音的局限性可以表現為,發音人員通常清楚地按照語言的語法順序發出測試語音,但使用過程中,用戶未必按照發音人員在測試中朗讀測試詞語時遵循的語法形式發出命令。人工發音的局限性,導致測試語音與用戶實際發音匹配度低,進而導致測試結果與現實中機器語音識別能力不符的問題,使得測試結果準確率低。
發明內容
有鑒于此,本發明實施例提一種語音識別能力測試方法和裝置,用以提高語音識別能力測試結果的準確率。
本發明實施例提供的一種語音識別能力測試方法,包括:
接收測試命令,所述測試命令中包括測試詞語和測試模式;
獲取與所述測試詞語和所述測試模式對應的測試音頻文件;
對所述測試音頻文件進行語音識別;
將所述識別結果與所述測試詞語進行相似度比較,以輸出測試結果。
本發明實施例提供的一種語音識別能力測試裝置,包括:
接收模塊,用于接收測試命令,所述測試命令中包括測試詞語和測試模式;
獲取模塊,用于獲取與所述測試詞語和所述測試模式對應的測試音頻文件;
識別模塊,用于對所述測試音頻文件進行語音識別;
比較模塊,用于將所述識別結果與所述測試詞語進行相似度比較,以輸出測試結果。
本發明實施例提供的一種語音識別能力測試方法和裝置,根據測試命令中的測試模式選擇測試命令中測試詞語對應的測試音頻文件,以進行語音識別能力測試。其中的測試模式可以有多種選擇,多種模式盡可能地模擬了使用過程中用戶的實際發音,即不同用戶的不同發音習慣,打破了現有人工發音進行測試的局限性,提高了測試音頻與用戶實際的發音匹配度,進而提高了語音識別能力測試的測試結果的準確率。
附圖說明
為了更清楚地說明本發明實施例或現有技術中的技術方案,下面將對實施例或現有技術描述中所需要使用的附圖作一簡單地介紹,顯而易見地,下面描述中的附圖是本發明的一些實施例,對于本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以根據這些附圖獲得其他的附圖。
圖1為本發明實施例提供的語音識別能力測試方法的可選實施例的步驟流程圖;
圖2為本發明實施例提供的語音識別能力測試方法的另一可選實施例的步驟流程圖;
圖3為本發明實施例提供的語音識別能力測試裝置的可選實施例的結構圖;
圖4為本發明實施例提供的語音識別能力測試裝置的另一可選實施例的結構圖。
具體實施方式
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于歌爾股份有限公司,未經歌爾股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710488838.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種全頻段合路器
- 下一篇:一種單饋源應急衛星通信裝置





