[發明專利]一種語音處理方法、裝置、存儲介質及電子設備有效
| 申請號: | 201910362700.8 | 申請日: | 2019-04-30 |
| 公開(公告)號: | CN110111778B | 公開(公告)日: | 2021-11-12 |
| 發明(設計)人: | 舒景辰;梁光;譚星;張岱;王正博 | 申請(專利權)人: | 北京大米科技有限公司 |
| 主分類號: | G10L15/08 | 分類號: | G10L15/08;G10L15/26;G06F40/284 |
| 代理公司: | 北京恒博知識產權代理有限公司 11528 | 代理人: | 范勝祥 |
| 地址: | 100007 北京市朝*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 語音 處理 方法 裝置 存儲 介質 電子設備 | ||
本申請實施例公開了一種語音處理方法、裝置、存儲介質及電子設備,其中,方法包括:采集所輸入的測評語音集合,對所述測評語音集合中各語音詞匯進行識別;當檢測到在所述測評語音集合中存在無法識別的目標語音詞匯時,采用音譯方式獲取所述目標語音詞匯對應的文本詞匯;輸出所述文本詞匯。因此,采用本申請實施例,通過對無法識別的目標語音詞匯對應的文本詞匯進行識別,可以提高對語音詞匯識別的智能性。
技術領域
本申請涉及計算機技術領域,尤其涉及一種語音處理方法、裝置、存儲介質及電子設備。
背景技術
作為人際交流的重要媒介,口語在實際生活中占有極其重要的地位。隨著社會經濟的不斷發展和全球化趨勢的加劇,人們對語言學習的效率以及語言評估的客觀性、公正性和規模化測試提出了越來越高的要求。隨著語音識別技術的不斷成熟,涉及到信號處理、自然語音理解、人工智能、數據挖掘和機器學習等多個學科的智能語音評測技術也得到了越來越廣泛的應用。例如,智能輔助教學系統項目在各中小學的推廣,普通話口語考試系統在全國的普及等。目前市面上出現了很多輔助口語評測類的電子產品(如點讀機、學習電腦)以及口語評測類應用。目前常見的口語學習場景都是指定朗讀文本,然后根據學習者朗讀的語音進行發音準確性和流暢度的評估。但是,指定朗讀文本,就限定了學習者必須指定一個既定的題目或者內容來進行口語練習。因此,為了讓學習者能夠更加方便地進行口語學習,自由朗讀題型便應運而生。自由朗讀題型,即學習者隨意選擇朗讀文本進行口語練習。
由于自由朗讀題型沒有標準答案,在對學習者自由朗讀的語音進行評測時,需要先對該語音進行識別,而學習者自由朗讀的文本中可能存在一些不常用詞匯,現有的語音評測技術無法對這些不常用詞匯進行識別,導致對語音詞匯識別的智能性低。
發明內容
本申請實施例提供了一種語音處理方法、裝置、存儲介質及電子設備,通過對無法識別的目標語音詞匯對應的文本詞匯進行識別,可以提高對語音詞匯識別的智能性。其技術方案如下;
第一方面,本申請實施例提供了一種語音處理方法,所述方法包括:
采集所輸入的測評語音集合,對所述測評語音集合中各語音詞匯進行識別;
當檢測到在所述測評語音集合中存在無法識別的目標語音詞匯時,采用音譯方式獲取所述目標語音詞匯對應的文本詞匯;
輸出所述文本詞匯。
第二方面,本申請實施例提供了一種語音處理裝置,所述裝置包括:
詞匯識別模塊,用于采集所輸入的測評語音集合,對所述測評語音集合中各語音詞匯進行識別;
詞匯獲取模塊,用于當檢測到在所述測評語音集合中存在無法識別的目標語音詞匯時,采用音譯方式獲取所述目標語音詞匯對應的文本詞匯;
詞匯輸出模塊,用于輸出所述文本詞匯。
第三方面,本申請實施例提供一種計算機存儲介質,所述計算機存儲介質存儲有多條指令,所述指令適于由處理器加載并執行上述的方法步驟。
第四方面,本申請實施例提供一種電子設備,可包括:處理器和存儲器;其中,所述存儲器存儲有計算機程序,所述計算機程序適于由所述處理器加載并執行上述的方法步驟。
本申請一些實施例提供的技術方案帶來的有益效果至少包括:
在本申請一個或多個實施例中,對采集的測評語音集合中的各語音詞匯進行識別,對于無法識別的目標語音詞匯,采用音譯方式獲取其對應的文本詞匯并進行輸出,從而通過對無法識別的目標語音詞匯對應的文本詞匯進行識別,可以提高對語音詞匯識別的智能性。
附圖說明
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京大米科技有限公司,未經北京大米科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910362700.8/2.html,轉載請聲明來源鉆瓜專利網。





