[發明專利]語速識別方法和裝置、服務器、計算機可讀存儲介質在審
| 申請號: | 201911304536.1 | 申請日: | 2019-12-17 |
| 公開(公告)號: | CN111179910A | 公開(公告)日: | 2020-05-19 |
| 發明(設計)人: | 袁丁 | 申請(專利權)人: | 深圳追一科技有限公司 |
| 主分類號: | G10L15/02 | 分類號: | G10L15/02;G10L15/06;G10L15/14;G10L15/26;G10L25/51;G06N3/04;G06N3/08 |
| 代理公司: | 廣州華進聯合專利商標代理有限公司 44224 | 代理人: | 方高明 |
| 地址: | 518051 廣東省深圳市南山區粵海街道*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語速 識別 方法 裝置 服務器 計算機 可讀 存儲 介質 | ||
本申請涉及一種語速識別方法和裝置、服務器、計算機可讀存儲介質,包括:將原始音頻幀序列按照預設規則劃分為多個音頻單元,對原始音頻幀序列中的音頻單元提取音頻特征,再將音頻單元的音頻特征輸入至預設語速識別模型中。不需要指定時間段來計算語速,從而避免了由于所指定的時間段大小不同而導致的效果差異,因此通過訓練出的預設語速識別模型所識別出的語速的準確性較高。且預設語速識別模型可以根據音頻單元的音頻特征,識別出原始音頻幀序列的實時語速,可以更好的捕獲用戶語速的動態變化情況,滿足更多場景的需求。
技術領域
本申請涉及計算機技術領域,特別是涉及一種語速識別方法和裝置、服務器、計算機可讀存儲介質。
背景技術
隨著語音識別技術的發展,識別準確率不斷提高,語音識別技術也被應用到越來越多的場景。語速作為情感表達重要的方式之一,是構成語言節奏的基礎,在語音識別、情感識別、口語練習等領域發揮著重要的作用。傳統的語速識別方法,通過簡單的計算來實現語速識別。顯然,這種統一的計算方式,不能夠適應不同用戶不同的說話習慣,且在復雜場景下的很難達到較好的識別效果。因此,亟待解決傳統的語速識別準確率較低的問題。
發明內容
本申請實施例提供一種語速識別方法、裝置、服務器、計算機可讀存儲介質,可以提高語速識別的準確性。
一種語速識別方法,包括:
獲取原始音頻幀序列,將所述原始音頻幀序列按照預設規則劃分為多個音頻單元;
對所述原始音頻幀序列中的音頻單元提取音頻特征;
將所述原始音頻幀序列中的音頻單元的音頻特征輸入至預設語速識別模型中,得到所述原始音頻幀序列的實時語速。
在其中一個實施例中,所述預設語速識別模型的生成過程包括:
對訓練集中的原始音頻幀序列進行文本標注,得到所述原始音頻幀序列的文本序列;
將所述文本序列與所述原始音頻幀序列對齊,得到所述文本序列與所述原始音頻幀序列的對齊關系;
根據所述文本序列與所述原始音頻幀序列的對齊關系,計算所述原始音頻幀序列中音頻單元的標注語速;
對所述原始音頻幀序列中的音頻單元提取音頻特征;
將所述原始音頻幀序列中音頻單元的標注語速及對應的音頻特征,輸入至初始化的回歸算法模型中進行訓練,對所述初始化的回歸算法模型進行調整,得到預設語速識別模型。
在其中一個實施例中,所述將所述文本序列與所述原始音頻幀序列對齊,得到所述文本序列與所述原始音頻幀序列的對齊關系,包括:
將所述文本序列與所述原始音頻幀序列通過高斯混合模型和隱馬爾可夫模型進行對齊,得到所述文本序列與所述原始音頻幀序列的對齊關系。
在其中一個實施例中,所述根據所述文本序列與所述原始音頻幀序列的對齊關系,計算所述原始音頻幀序列中音頻單元的標注語速,包括:
將所述原始音頻幀序列按照預設規則劃分為多個音頻單元;
根據所述文本序列與所述原始音頻幀序列的對齊關系,計算所述每個音頻單元所包含的完整的文本數量;
根據所述每個音頻單元所包含的完整的音節數量及所述完整的音節數量所對應的音頻幀的數量,計算得到所述每個音頻單元的標注語速。
在其中一個實施例中,所述回歸算法模型包括雙層長短期記憶網絡模型;
所述將所述原始音頻幀序列中音頻單元的語速及對應的音頻特征,輸入至初始化的回歸算法模型中進行訓練,對所述初始化的回歸算法模型進行調整,得到預設語速識別模型,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳追一科技有限公司,未經深圳追一科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911304536.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種快速過濾排渣裝置
- 下一篇:生產高氮高硅氮化釩鐵的方法





