[發明專利]語音的處理方法及裝置、存儲介質、電子設備有效
| 申請號: | 201910540082.1 | 申請日: | 2019-06-21 |
| 公開(公告)號: | CN110223673B | 公開(公告)日: | 2020-01-17 |
| 發明(設計)人: | 聶鐳;李睿;聶穎 | 申請(專利權)人: | 龍馬智芯(珠海橫琴)科技有限公司 |
| 主分類號: | G10L15/02 | 分類號: | G10L15/02;G10L15/06;G10L15/26;G10L25/51 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 519000 廣東省珠海市橫琴新區環島*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 音素 語音識別 語音樣本 存儲介質 電子設備 收集效率 文本信息 預測模型 采集 相似度確定 低成本 相似度 預測 轉化 | ||
本發明提供了一種語音的處理方法及裝置、存儲介質、電子設備,其中,該方法包括:將語音輸入預先訓練好的音素預測模型,獲得所述語音對應的預測音素,計算所述預測音素與所述語音的標準音素之間的音素相似度,基于所述音素相似度確定所述語音是否滿足采集要求,可見,對于語音的采集不需要先進行語音識別得到該語音的文本信息,而是通過訓練的音素預測模型確定語音是否滿足采集要求,從而解決了相關技術中語音樣本收集需要先對語音進行語音識別轉化為文本信息,由于語音識別不準確,導致語音樣本收集效率低、成本高的技術問題,達到了語音樣本收集效率高和低成本的效果。
技術領域
本發明涉及計算機技術領域,具體而言,涉及一種語音的處理方法及裝置、存儲介質、電子設備。
背景技術
現有技術對語音數據進行采集的時候,需要對被收集語音的質量和內容進行識別判斷。確保所收集的語音是有質量的,語音的內容要符合要求。但是,完全絕對的語音音素匹配實際上是不可行的。原因有二,首先,因為我國的地域廣大,各地口音眾多,完全絕對的語音匹配不能滿足同時收集各地口音不一致的語音。其次,我們的收集需求不要求100%完全匹配通過時(如,訓練命令詞和喚醒詞的神經網絡)。語音音素完全匹配會損失掉大量的語音樣本,造成語音樣本收集效率低和增加語音收集的成本。
此外,現有技術中公開了一種通過對語音數據進行語音識別得到與語音數據對應的目標文本,再將目標文本與初始語料進行文本相似度匹配,得到目標文本與初始語料之間的文本相似度,進而根據該文本相似度來確定目標文本對應的語音數據是否符合要求。但是,此種方法依賴于語音識別的準確度,當語音識別不準確時(特別是帶有口音的語音數據),會造成大量原本合格的語音樣本的損失,造成語音樣本收集效率低和增加語音收集的成本。
針對相關技術中的上述問題,目前尚未存在有效的解決方案。
發明內容
本發明實施例提供了一種語音的處理方法及裝置、存儲介質、電子設備,以至少解決相關技術中語音樣本收集效率低、成本高的技術問題。
根據本發明的一個實施例,提供了一種語音的處理方法,包括:將語音輸入預先訓練好的音素預測模型,獲得所述語音對應的預測音素;對所述預測音素與所述語音的標準音素進行音素相似度匹配,得到所述預測音素與所述語音的標準音素之間的音素相似度;基于所述音素相似度確定所述語音是否滿足采集要求。
根據本發明的另一個實施例,提供了一種語音的處理裝置,包括:音素預測模塊,用于將語音輸入預先訓練好的音素預測模型,獲得所述語音對應的預測音素;音素相似度計算模塊,用于對所述預測音素與所述語音的標準音素進行音素相似度匹配,得到所述預測音素與所述語音的標準音素之間的音素相似度;判斷模塊,用于基于所述音素相似度確定所述語音是否滿足采集要求。
根據本發明的又一個實施例,還提供了一種存儲介質,所述存儲介質中存儲有計算機程序,其中,所述計算機程序被設置為運行時執行上述任一項方法實施例中的步驟。
根據本發明的又一個實施例,還提供了一種電子設備,包括存儲器和處理器,所述存儲器中存儲有計算機程序,所述處理器被設置為運行所述計算機程序以執行上述任一項方法實施例中的步驟。
通過本發明,將語音輸入預先訓練好的音素預測模型,獲得所述語音對應的預測音素,計算所述預測音素與所述語音的標準音素之間的音素相似度,基于所述音素相似度確定所述語音是否滿足采集要求,可見,對于語音的采集不需要先進行語音識別得到該語音的文本信息,而是通過訓練的音素預測模型確定語音是否滿足采集要求,從而解決了相關技術中語音樣本收集需要先對語音進行語音識別轉化為文本信息,由于語音識別不準確,導致語音樣本收集效率低、成本高的技術問題,達到了語音樣本收集效率高和低成本的效果。
附圖說明
此處所說明的附圖用來提供對本發明的進一步理解,構成本申請的一部分,本發明的示意性實施例及其說明用于解釋本發明,并不構成對本發明的不當限定。在附圖中:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于龍馬智芯(珠海橫琴)科技有限公司,未經龍馬智芯(珠海橫琴)科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910540082.1/2.html,轉載請聲明來源鉆瓜專利網。





