[發明專利]語音處理方法及裝置、計算機可讀介質、電子設備在審
| 申請號: | 202011139830.4 | 申請日: | 2020-10-22 |
| 公開(公告)號: | CN112349294A | 公開(公告)日: | 2021-02-09 |
| 發明(設計)人: | 李應弟;劉洪;李丹;賈鵬飛 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G10L25/03 | 分類號: | G10L25/03;G10L25/48;G10L15/02;G10L15/183 |
| 代理公司: | 深圳市隆天聯鼎知識產權代理有限公司 44232 | 代理人: | 葉虹 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 處理 方法 裝置 計算機 可讀 介質 電子設備 | ||
本公開提供了一種語音處理方法及裝置、計算機可讀介質、電子設備,涉及人工智能領域。方法包括:獲取具有變異音的語音信息,對語音信息進行預處理以獲取語音特征信息;對語音特征信息進行特征提取,以獲取與語音特征信息對應的狀態信息;根據狀態信息和多發音詞典確定與語音信息對應的具有標準音的文本信息,其中多發音詞典是根據具有標準音的第一詞匯和與第一詞匯具有相同語義且具有變異音的第二詞匯構建的,第一詞匯和第二詞匯為拼音文字。本公開能夠基于標準音音素和變異音音素之間的發音變異規則確定多發音詞典,避免了大量標注語料,節省了標注成本和時間,并且能夠根據多發音詞典進行語音處理,提高了處理效率和精準度。
技術領域
本公開涉及人工智能技術領域,具體而言,涉及一種語音處理方法、語音處理裝置、計算機可讀介質及電子設備。
背景技術
語言是由詞匯按一定的語法所構成的語音表義系統,世界各個民族都有自己的語言,即使是同一個民族也會衍生出多種不同的語言,并且各類語言中還會存在發音變異的現象,例如新疆維吾爾自治區有45%的居民是維吾爾族,維吾爾語是他們主要的溝通工具,目前維吾爾語方言分為中心方言、和田方言和羅布方言,其中中心方言對應標準音,是新疆通用的官方標準語,而和田方言和羅布方言對應變異音,只在局部地區被使用。
隨著人工智能技術的發展,人們主要通過機器學習模型進行語音處理任務。在對機器學習模型進行訓練時,通常需要對具有變異音的語料進行標注,然后再根據標注的語料進行標注建模,但是由于語料標注難度大,并且對標注者的語言能力要求高,因此使得人工標注周期長,成本高,同時由于語料庫有限,導致訓練后的模型性能一般,無法有效識別具有變異音的語音信息,進而降低了用戶體驗。
需要說明的是,在上述背景技術部分公開的信息僅用于加強對本公開的背景的理解,因此可以包括不構成對本領域普通技術人員已知的現有技術的信息。
發明內容
本公開的實施例提供了一種語音處理方法、語音處理裝置、計算機可讀介質及電子設備,進而至少在一定程度上可以基于語言規則直接建立具有標準音的語言和具有變異音的語言的發音變異規則,進而根據具有標準音的詞匯和對應的具有變異音的詞匯構建多發音詞典,并根據多發音詞典進行語音處理,避免了人工標注,降低了人工標注成本,并且基于多發音詞典可以提高對具有變異音的語音信息的處理精度和處理效率。
本公開的其他特性和優點將通過下面的詳細描述變得顯然,或部分地通過本公開的實踐而習得。
根據本公開實施例的一個方面,提供了一種語音處理方法,包括:獲取具有變異音的語音信息,對所述語音信息進行預處理以獲取語音特征信息;對所述語音特征信息進行特征提取,以獲取與所述語音特征信息對應的狀態信息;根據所述狀態信息和多發音詞典確定與所述語音信息對應的具有標準音的文本信息,其中所述多發音詞典是根據具有標準音的第一詞匯和與所述第一詞匯具有相同語義且具有變異音的第二詞匯構建的,所述第一詞匯和所述第二詞匯為拼音文字。
根據本公開實施例的一個方面,提供了一種語音處理裝置,包括:預處理模塊,用于獲取具有變異音的語音信息,對所述語音信息進行預處理以獲取語音特征信息;狀態信息獲取模塊,用于對所述語音特征信息進行特征提取,以獲取與所述語音特征信息對應的狀態信息;文本獲取模塊,用于根據所述狀態信息和多發音詞典確定與所述語音信息對應的具有標準音的文本信息,其中所述多發音詞典是根據具有標準音的第一詞匯和與所述第一詞匯具有相同語義且具有變異音的第二詞匯構建的,所述第一詞匯和所述第二詞匯為拼音文字。
根據本公開實施例的一個方面,提供了一種計算機可讀介質,其上存儲有計算機程序,所述程序被處理器執行時實現如上述的可選實現方式中提供的語音處理方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011139830.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種變電站圖紙資料管理查詢系統
- 下一篇:一種新一代信息技術用圖像識別設備





